第 10章 数字图书馆
10.1 数字图书馆概述
? 数字图书馆的概念
? 数字图书馆的特征
10.1.1 数字图书馆的概念
? 1988年,美国国家科学基金会的伍尔夫
(W.Wulf)在撰写国际合作白皮书时,首先
提出了“数字图书馆” (Digital Library)
这一新的名词。
? 图书馆界的定义
? IT业的定义
? IITA定义
? IBM公司的定义
? 吴志荣( 2000年)指出,数字图书馆是运用当代信
息技术,对数字信息资源进行采集、整理和存储,
并向所有连接网络的用户提供,为一定的社会政治、
经济服务的文化教育机构以及这种机构的组合。同
时指出单一的“文化教育机构”是狭义的数字图书
馆,而“这种机构的组合”就是广义的数字图书馆。
在广义网络出版中,文化教育机构是网络出版商重
要的组成部分,数字图书馆无论是“机构”还是
“机构的组合”,都是网络出版商。
一些相似的概念
? 电子图书馆
? 【 案例 10-1】 从“电子图书馆”到“数字图书馆”
的过渡
? 虚拟图书馆
? 无墙图书馆
与传统图书馆的比较
传统图书馆 自动化图书馆 数字图书馆
工作中心 馆藏 馆藏 用户
馆藏形式 印刷型 印刷型及电子出版物 数字信息资源
工作方式 手工作业 对书目数据及专题数据库进行自
动化加工
对文献内容进行自动化
加工
检索手段 卡片检索 对书目数据及专题数据库进行自
动化检索
对文献内容进行智能检
索
服务对象 到馆读者 到馆读者为主,在一定范围内提
供文献传递服务
可面向全球读者提供网
上服务
馆藏加工 不加工 基本不加工 加工,并使馆藏增值
10.1.2 数字图书馆的特点
? 资源数字化
? 系统网络化
? 【 案例 10-2】 亚历山大数字图书馆项目
? 服务知识化
? 【 案例 10-3】 密歇根大学“数字图书馆”
10.2 数字图书馆的发展
10.2.1 数字图书馆的发展阶段
? 总体发展
? 【 案例 10-4】 G8全球信息社会电子图书馆项目
? 发展阶段
1,资源数字化阶段
? 【 案例 10-5】, 美国往事, 数字图书馆
2,信息集成服务阶段
? 【 案例 10-6】 美国, 数字图书馆倡议, 计划
2,用户信息活动阶段
10.2.2 中国的数字图书馆发展
? 发展概况
? 【 案例 10-7】 中国高等教育文献保障系统 CALIS
? 中国数字图书馆工程
中国数字图书馆系统框图
中国数字图书馆建设的内容包括
? 数字资源建设
? 软 /硬件基础设施建设
? 应用系统开发
? 标准规范制定
? 信息服务
? 人才建设及知识产权的解决
10.3 数字图书馆的建设
? 数字图书馆的建设重点在于技术与功能实现
及其体系的构建,标准和规范的完善,资源
的数字化以及分布式海量资源库的创建,建
设模式与服务模式的设计和实施。它涉及数
字信息资源的生产、加工、存储、检索、传
递、保护、利用、归档、剔除等全过程。数
字图书馆的设计强调基本体系结构简单化、
功能模块化,并选取选取成熟的通用标准和
协议。
10.3.1 数字图书馆的建设概述
? 建设模式
? 【 案例 10-8】 超星数字图书馆
? 基本体系结构
? 体系结构的设计原则
? 【 案例 10-9】 斯坦福大学数字图书馆计划
? 数字图书馆的功能模块
建设模式
? 目前有四种模式发展数字图书馆:
1,技术研究型
2,国家图书馆行为
3,大学图书馆计划
4,提供数字图书馆软件系统和应用服务
基本体系结构
体系结构的设计原则
? 开放性
? 互操作性
? 扩展性
? 伸缩性
斯坦福大学数字图书馆计划
数字图书馆的功能模块
? 资源获取和创建系统
? 存储管理系统
? 内容发布系统
? 查询和访问系统
? 版权管理系统
? 资源调度系统
数字内容的获取和制作
? 数字内容的获取就是信息资源的数字化, 就
是把原始的文字, 声音, 影像等资料转换成
数字文档存储在一定的物理介质上 。 数字内
容的制作和获取是数字图书馆中首要的基本
功能, 同时要完成资源库的建设 。
电子贝奥伍尔弗项目
数字内容的存储和管理
? 数字内容的存储和管理是数字图书馆建设中
最核心的问题,尤其是超大容量信息的组织
和存储,将决定数字图书馆系统的应用能力
和灵活性。
内容的发布和传输
? 数字图书馆的内容发布一般采用 Web技术发布
信息,这实际上是内容的传输过程。这既可
以是文档的传输,也可以是流媒体服务。
查询和访问
? 数字图书馆在把资源的组织分为元数据和对象数据
时,查询系统针对元数据的集合,版权管理针对对
象数据的集合。
? 数字资源的查询包含了文献、图像、音频和视频的
检索。其中,文献检索技术已全文检索为主。对于
各种数字内容的智能化查询是数字图书馆实现技术
中比较重要的一部分,基于图表文字的智能化查询
已经有稳定成熟的技术出现,而基于图像的查询还
在研究和试验阶段。
信息的安全和版权管理
? 数字图书馆要保证信息资源在网络环境中创
建、存储、传输和应用的安全,要实施有效
的版权管理,需要许可证协议、支付系统、
用户认证和使用跟踪等一系列的技术,也要
使最终用户可以方便地完成数据的检索和传
输。
? 【 案例 10-11】 IBM数字图书馆方案
数字图书馆的相关技术和标准
? 数字图书馆相关技术
? 数字图书馆的相关标准和规范
? 元数据
数字图书馆相关技术
? 数字图书馆建设必须使用高新技术做支撑,
同时,数字图书馆的相关技术在不断地发展
和演进。国际上关于数字图书馆的阶段性成
果很多,包括采用数字对象为基本元素的数
据管理技术、采用 SGML/XML对多媒体资源进
行置标、采用面向对象的技术等。
数字图书馆的关键技术
? 内容处理技术
? 信息存取技术
? 用户界面技术
? 互操作性技术
? 可扩充性技术
? 开放系统开发技术
? 高灵活性系统开发技术
根据应用层面上划分
? 系统结构设计技术
? 专用技术
? 集成技术
10.3.2 数字图书馆的相关标准和规范
? 主要涉及的基础标准,
1,数字内容加工
2,数据元素
3,描述语言
4,电子图书
元数据
? 元数据是“关于数据的数据”,它提供关于
信息资源或数据的一种结构化的数据,是对
信息资源的结构化的描述。
? 它的作用是描述信息资源或数据本身的特征
和属性,规定数字内容的组织,具有定位、
检索、证明、评估、选择等功能。
元数据的标准和规范
元素 标记 简要描述
资源名 <dc:Title </dc:Title 资源对象正式公开的名称
创建者 <dc:Creator </dc:Creator 创建资源内容的主要责任者
主题 <dc:Subject </dc:Subject 资源内容的主题描述
说明 <dc:Description </dc:Description 资源内容的解释
出版者 <dc:Publisher </dc:Publisher 使资源成为可获得并可用的责任者
其他责任者 <dc:Contributor </dc:Contributor 对资源的内容作出贡献的其他实体
日期 <dc:Date </dc:Date 出版物的日期,遵循 ISO 8601
资源类型 <dc:Type </dc:Type 内容的种类、作用、书卷等描述
格式 <dc:Format </dc:Format 媒体类型和内容来源描述
资源标识符 <dc:Identifier </dc:Identifier 惟一标识出版物,可用 ISBN,DOI
来源 <dc:Source </dc:Source,现稿若改编时注明的来源
语种 <dc:Language </dc:Language 内容的语言标注,符合 RFC 3066
关联 <dc:Relation </dc:Relation 相关资源的参考
覆盖范围 <dc:Coverage </dc:Coverage 资源内容所涉及的外延与覆盖范围
权限 <dc:Rights </dc:Rights 资源拥有的或被赋予的权限信息
10.1 数字图书馆概述
? 数字图书馆的概念
? 数字图书馆的特征
10.1.1 数字图书馆的概念
? 1988年,美国国家科学基金会的伍尔夫
(W.Wulf)在撰写国际合作白皮书时,首先
提出了“数字图书馆” (Digital Library)
这一新的名词。
? 图书馆界的定义
? IT业的定义
? IITA定义
? IBM公司的定义
? 吴志荣( 2000年)指出,数字图书馆是运用当代信
息技术,对数字信息资源进行采集、整理和存储,
并向所有连接网络的用户提供,为一定的社会政治、
经济服务的文化教育机构以及这种机构的组合。同
时指出单一的“文化教育机构”是狭义的数字图书
馆,而“这种机构的组合”就是广义的数字图书馆。
在广义网络出版中,文化教育机构是网络出版商重
要的组成部分,数字图书馆无论是“机构”还是
“机构的组合”,都是网络出版商。
一些相似的概念
? 电子图书馆
? 【 案例 10-1】 从“电子图书馆”到“数字图书馆”
的过渡
? 虚拟图书馆
? 无墙图书馆
与传统图书馆的比较
传统图书馆 自动化图书馆 数字图书馆
工作中心 馆藏 馆藏 用户
馆藏形式 印刷型 印刷型及电子出版物 数字信息资源
工作方式 手工作业 对书目数据及专题数据库进行自
动化加工
对文献内容进行自动化
加工
检索手段 卡片检索 对书目数据及专题数据库进行自
动化检索
对文献内容进行智能检
索
服务对象 到馆读者 到馆读者为主,在一定范围内提
供文献传递服务
可面向全球读者提供网
上服务
馆藏加工 不加工 基本不加工 加工,并使馆藏增值
10.1.2 数字图书馆的特点
? 资源数字化
? 系统网络化
? 【 案例 10-2】 亚历山大数字图书馆项目
? 服务知识化
? 【 案例 10-3】 密歇根大学“数字图书馆”
10.2 数字图书馆的发展
10.2.1 数字图书馆的发展阶段
? 总体发展
? 【 案例 10-4】 G8全球信息社会电子图书馆项目
? 发展阶段
1,资源数字化阶段
? 【 案例 10-5】, 美国往事, 数字图书馆
2,信息集成服务阶段
? 【 案例 10-6】 美国, 数字图书馆倡议, 计划
2,用户信息活动阶段
10.2.2 中国的数字图书馆发展
? 发展概况
? 【 案例 10-7】 中国高等教育文献保障系统 CALIS
? 中国数字图书馆工程
中国数字图书馆系统框图
中国数字图书馆建设的内容包括
? 数字资源建设
? 软 /硬件基础设施建设
? 应用系统开发
? 标准规范制定
? 信息服务
? 人才建设及知识产权的解决
10.3 数字图书馆的建设
? 数字图书馆的建设重点在于技术与功能实现
及其体系的构建,标准和规范的完善,资源
的数字化以及分布式海量资源库的创建,建
设模式与服务模式的设计和实施。它涉及数
字信息资源的生产、加工、存储、检索、传
递、保护、利用、归档、剔除等全过程。数
字图书馆的设计强调基本体系结构简单化、
功能模块化,并选取选取成熟的通用标准和
协议。
10.3.1 数字图书馆的建设概述
? 建设模式
? 【 案例 10-8】 超星数字图书馆
? 基本体系结构
? 体系结构的设计原则
? 【 案例 10-9】 斯坦福大学数字图书馆计划
? 数字图书馆的功能模块
建设模式
? 目前有四种模式发展数字图书馆:
1,技术研究型
2,国家图书馆行为
3,大学图书馆计划
4,提供数字图书馆软件系统和应用服务
基本体系结构
体系结构的设计原则
? 开放性
? 互操作性
? 扩展性
? 伸缩性
斯坦福大学数字图书馆计划
数字图书馆的功能模块
? 资源获取和创建系统
? 存储管理系统
? 内容发布系统
? 查询和访问系统
? 版权管理系统
? 资源调度系统
数字内容的获取和制作
? 数字内容的获取就是信息资源的数字化, 就
是把原始的文字, 声音, 影像等资料转换成
数字文档存储在一定的物理介质上 。 数字内
容的制作和获取是数字图书馆中首要的基本
功能, 同时要完成资源库的建设 。
电子贝奥伍尔弗项目
数字内容的存储和管理
? 数字内容的存储和管理是数字图书馆建设中
最核心的问题,尤其是超大容量信息的组织
和存储,将决定数字图书馆系统的应用能力
和灵活性。
内容的发布和传输
? 数字图书馆的内容发布一般采用 Web技术发布
信息,这实际上是内容的传输过程。这既可
以是文档的传输,也可以是流媒体服务。
查询和访问
? 数字图书馆在把资源的组织分为元数据和对象数据
时,查询系统针对元数据的集合,版权管理针对对
象数据的集合。
? 数字资源的查询包含了文献、图像、音频和视频的
检索。其中,文献检索技术已全文检索为主。对于
各种数字内容的智能化查询是数字图书馆实现技术
中比较重要的一部分,基于图表文字的智能化查询
已经有稳定成熟的技术出现,而基于图像的查询还
在研究和试验阶段。
信息的安全和版权管理
? 数字图书馆要保证信息资源在网络环境中创
建、存储、传输和应用的安全,要实施有效
的版权管理,需要许可证协议、支付系统、
用户认证和使用跟踪等一系列的技术,也要
使最终用户可以方便地完成数据的检索和传
输。
? 【 案例 10-11】 IBM数字图书馆方案
数字图书馆的相关技术和标准
? 数字图书馆相关技术
? 数字图书馆的相关标准和规范
? 元数据
数字图书馆相关技术
? 数字图书馆建设必须使用高新技术做支撑,
同时,数字图书馆的相关技术在不断地发展
和演进。国际上关于数字图书馆的阶段性成
果很多,包括采用数字对象为基本元素的数
据管理技术、采用 SGML/XML对多媒体资源进
行置标、采用面向对象的技术等。
数字图书馆的关键技术
? 内容处理技术
? 信息存取技术
? 用户界面技术
? 互操作性技术
? 可扩充性技术
? 开放系统开发技术
? 高灵活性系统开发技术
根据应用层面上划分
? 系统结构设计技术
? 专用技术
? 集成技术
10.3.2 数字图书馆的相关标准和规范
? 主要涉及的基础标准,
1,数字内容加工
2,数据元素
3,描述语言
4,电子图书
元数据
? 元数据是“关于数据的数据”,它提供关于
信息资源或数据的一种结构化的数据,是对
信息资源的结构化的描述。
? 它的作用是描述信息资源或数据本身的特征
和属性,规定数字内容的组织,具有定位、
检索、证明、评估、选择等功能。
元数据的标准和规范
元素 标记 简要描述
资源名 <dc:Title </dc:Title 资源对象正式公开的名称
创建者 <dc:Creator </dc:Creator 创建资源内容的主要责任者
主题 <dc:Subject </dc:Subject 资源内容的主题描述
说明 <dc:Description </dc:Description 资源内容的解释
出版者 <dc:Publisher </dc:Publisher 使资源成为可获得并可用的责任者
其他责任者 <dc:Contributor </dc:Contributor 对资源的内容作出贡献的其他实体
日期 <dc:Date </dc:Date 出版物的日期,遵循 ISO 8601
资源类型 <dc:Type </dc:Type 内容的种类、作用、书卷等描述
格式 <dc:Format </dc:Format 媒体类型和内容来源描述
资源标识符 <dc:Identifier </dc:Identifier 惟一标识出版物,可用 ISBN,DOI
来源 <dc:Source </dc:Source,现稿若改编时注明的来源
语种 <dc:Language </dc:Language 内容的语言标注,符合 RFC 3066
关联 <dc:Relation </dc:Relation 相关资源的参考
覆盖范围 <dc:Coverage </dc:Coverage 资源内容所涉及的外延与覆盖范围
权限 <dc:Rights </dc:Rights 资源拥有的或被赋予的权限信息