中国科学院研究生院科技情报检索课程第五讲计算机信息检索概述计算机信息检索的定义计算机信息检索是指利用计算机进行信息存贮和检索的全过程。
广义上讲,凡是用计算机来查询特定的问题都可以说是计算机信息检索。又可以定义为利用计算机在有限的数据集合中查找具有某些特性的子集的过程。
计算机信息检索原理(一)
计算机信息检索是用计算机代替人工检索的匹配过程。计算机一方面接受检索提问(即检索提问表达式),另一方面从数据库中接受文献记录,然后在两者之间进行匹配运算,即将检索提问与数据库中文献记录标识进行比较,如果比较结果一致,那么这篇文献可能是需要的。如果比较结果不一致,该篇文献则不符合检索要求,不是用户所需要的。
计算机信息检索原理(二)
计算机信息检索的原理可以用下图表示:
检索提问 匹配运算 数据库命中文献计算机信息检索的构成一般来说,一个计算机信息检索系统应由三部分构成:
( 1)计算机硬件:包括计算机、输入输出设备,及网络系统等。
( 2)计算机软件:包括数据加工、处理和检索的各种系统软件和应用软件。
( 3)机读数据库:包括各种类型的数据集合,是检索的对象,存储在磁带、磁盘或光盘上。
计算机信息检索的类型根据检索系统的工作方式,可以分为:
( 1)脱机检索:利用计算机的输入输出装置进行检索,用户不参与检索过程。
( 2)联机检索:用户直接与计算机对话,
参与检索过程,可随时修改检索策略。
( 3)网络化信息检索:利用网络,特别是互联网进行检索的方式。
( 4)光盘检索:利用光盘存储和传送数据,在本地进行检索的方式。
计算机信息检索的类型根据信息的服务方式,可以分为:
( 1)定题检索:根据课题的需要,事先编写出检索提问式,定期检索不断更新的数据库,定期将检索结果提供给用户。
( 2)回溯检索:针对某一课题的需要,
一次检索若干年的数据,或检索数据库中所包含的所有数据。
计算机信息检索发展概况
40多年来,随着现代计算机技术、现代通讯技术以及存贮介质的发展,计算机信息检索大体经历了以下几个阶段:
( 1)脱机检索阶段( 1954—1964)
( 2)联机检索阶段( 1965—1972)
( 3)国际联机检索阶段( 1972年至今)
( 4)光盘检索阶段( 1985年至今)
( 5)网络化检索阶段( 1990年代至今)
脱机检索阶段( 1954—1964)
1946年发明计算机,50年代开始应用于信息检索。 54年美国海军建成世界第一个试验性的计算机检索系统,59年建成第一个定题检索服务系统,61年 CA开始用计算机编制,化学题录,,64年美国医学图书馆完成医学文献分析与检索系统
MEDLARS。
联机检索阶段( 1965—1972)
60年代初美国开始进行计算机联机检索试验,62年 MIT建成试验性的联机检索系统。 65年进行了首次全国性的联机检索表演,67年后,许多联机检索系统相继建成。包括 69年 NASA的 RECON系统,70年的洛克希德公司的 DIALOG和 SDC的
ORBIT和 MEDLARS 的 MEDLINE系统。
国际联机检索阶段( 1972年至今)
现代通讯技术的发展,为国际联机检索阶段奠定了基础。 72年 DIALOG、
ORBIT和 MEDLINE相继开展国际联机检索服务,通过海底电缆和卫星通讯等手段提供国际联机检索服务。目前,多通过互联网提供检索服务,依旧是最为重要的信息检索对象。
光盘检索阶段( 1985年至今)
1985年世界上第一张商品化的光盘数据库- Bibliofile问世,随即出版了大量的以光盘为载体的电子出版物和文摘数据库。
在 10余年的时间里,处于与国际联机检索平分秋色地位。目前,仍有着广泛的应用领域。近年来,随着网络信息检索的发展,
光盘检索的地位正在降低。
网络化检索阶段( 1990年代至今)
1990年代以来,互联网在世界范围内迅速发展,网上信息资源也迅猛增加,近年来出现了许多免费或收费低廉的信息资源,不仅极大地丰富了信息资源的获取途径,而且突破了信息检索必须由专业人员操作的模式,普通用户可以直接在网上查询自己所需要的信息。
我国计算机检索发展概况
1.试验准备阶段 --70年代中期至 80年代初期
2.联机检索阶段 -- 80年代中期至 90年代初期
3.网络化检索阶段 -- 90年代中期至现在
4.自建数据库发展阶段 -- 90年代初期至现在计算机信息检索技术
1、逻辑检索
2、加权检索
3、词表助检
4、截词检索
5、限定检索逻辑检索逻辑检索的基础是布尔逻辑运算,
主要是“与”,“或”,“非”的运算。
逻辑“与” 用,AND‖或,*”代表,
两个词用,AND‖或,*”相连,表示被检中的文献中必须同时含有这两个词。
例如:
COMPUTER *LIBRARY
逻辑检索逻辑“或” 用,OR‖或,+‖代表,
两个词之间用,OR‖或,+‖相连,表示被检中的文献中要含有两词之一或同时含有这两个词。例如:
COMPUTER + ROBOT
逻辑检索逻辑“非” 用,NOT‖或,–‖代表,
两个词之间用,NOT‖或,–‖相连,表示被检索文献在含有前一个词而不含有后一个词的情况下才被命中。例如:
CAR – TRACTOR
加权检索加权检索是一种定量检索方式,其基本方法是在每个检索词后面加上一个数字,该数字表示检索词的“权”( Weight),表明该词的重要程度。一篇文献是否被命中,要根据它所含检索词的“权”值之和来决定。如果一篇文献所含检索词“权”值之和大于或等于所指定的权值,该篇文献则命中,否则不命中。
加权检索例如:检索词及各词的权值为:
RADAR(10),LASER(10),COMMUNICATION(20)
指定权值为 30
其检索结果是:仅含有任一一词或仅含有
RADAR和 LASER这两个词的文献将不被命中,
含有三个词或含有 COMMUNICATION及另外任一一词的文献,均成为命中文献。
词表助检有些文献数据库有自己的词表,词表不仅用于标引文献,还可用于助检。
检索者只需在词表中找到相应的检索词,
便可直接利用该词检索文献。有些词表还具有记忆和扩检功能,便于用户建立自己的词表体系。
截词检索截词检索用于将检索词与标引词进行相似性运算。常用的截词检索功能主要有三种:
开放式截断(词尾无限截断)常用,*”
例如,CENT * 检索结果可以是:
CENTER,CENTRE或 CENTERING等截词检索限制式截断(词尾有限截断)常用
“?” (截断的字母数量与“?”的数量相同)例如,CAT 检索结果可以是:
CAT,CATS,CATO,CATCH 等嵌入式截断(中间截断)常用“?”
例如,WOM?N 检索结果可以是:
WOMAN 或 WOMEN
限定检索限定检索是指将检索过程限定在一定的范围内进行,有利于提高检索的查全率和查准率。例如,限制在某一字段或限制在某一时间范围内。主题性质的字段主要有:叙词( / DE,/ DF)、标引词( /
ID,DF/ )、文章标题( /TI)、文摘
( /AB)等。
计算机信息检索的基本程序与策略一、分析检索课题二、选择检索系统和数据库三、选择检索词,构造检索提问式,
确定检索策略四、分析检索结果,调整检索策略分析检索课题分析检索课题应注意以下几个方面:
1、了解情报需求的目的和意图。
2、分析检索课题的主题要求。
3、时间要求。
4、检索效果要求。
5、检索费用及其它要求。
选择检索系统和数据库在具体数据库选择过程中应注意:
1、明确数据库收录的数量、类型、存贮年限和更新周期。
2、明确数据库所具有的特殊性和交叉性。
3、明确数据库所提供的检索途径、功能和服务方式。
检索词的选择(一)
检索词是表达文献信息需求的基本元素,
也是计算机检索系统中有关数据库进行匹配的基本单元。在计算机检索系统中,检索词一般有如下三种形式:
1、规范词:是经过规范化处理的词或词组。
2、规范化的代码:是经过规范化处理的索引代码。
3、自由词:是未经规范化处理的自然语言词汇。
检索词的选择(二)
选择检索词一般要考虑以下基本原则:
1、所选数据库有叙词表和主题词表的,优先选用叙词或主题词作为最基本的检索项目。
2、要从词表规定的专业范围出发,选用各学科内具有检索价值的基本名词术语。
3、如选择的检索词无词表可查,或在词表中未反映的,可选择自由词作为检索词。
4、选词要适应待检数据库的检索用词规则。
5、通常要选择常用的基本词汇进行组配。
检索提问式的构造方法检索提问式,是指在计算机信息检索过程中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其它组配连接符号组成。
一种较规范性地构造检索式的方法叫做,聚类组合法,。它是对构造检索式的思维过程进行规范的一些具体方法,主要是通过实施以下七项操作来生成检索式,即:切分、删除、替换、聚类、补充、增加和组合。
第一步 切分例:“染料电化学性能的研究”,经切分后为
,|染料 |电化学 |性能 |的 |研究 |‖
注意:词是语义切分的最小单元,也是检索单元。切分必须到词为止,否则就会失去原来的涵义而产生错误。如上例中若将“电化学”
继续切分为,|电 |化学 |‖,就会与原义相差甚远。
第二步 删除删除是对经切分后的课题语句中不适宜作为检索词的词进行删除。
1、删除不具有检索意义的虚词及其他非关键词。
2、删除过分宽泛和过分具体的限定词。
3、删除存在蕴涵关系的可合并词。
第三步 替换用户在提出课题时,可能会用一些表达欠佳的词汇来表达其情报需求,或用词太宽泛,
或太狭窄,或根本不可作为检索词的词。在这些情况下,应用概念替换法,引入更明确、更具体、更本质的概念作为替换词或补充词。
例如:大气中细菌浓度的计算方法大气污染的计算方法
(替换为)
第四步 聚类
―聚类组合法”的第四步是对切分出来的单元按语义进行聚类(同类合并),即将
“彼此非常相关的词”归于一组。“彼此非常相关的词”意指同义词或彼此有依附关系的词等,亦即在检索式中可以相互替换、相互补充以及相互等效的词。聚类的实质是进行组面分析,经过聚类,语句由词的集合转换为概念(组面)的集合。
第四步 聚类(二)
例如:高层建筑的优化设计
(切分)
高层 |建筑 |的 |优化 |设计
(删除)
高层 |建筑 |优化 |设计
(替换)
高层 |建筑 |优化 |结构设计
(聚类)
高层建筑 |优化 |结构设计第五步 补充许多名词是由词组缩略而成的;有的词或词组具有同义词或相关词。对于由词组缩略而成的词,它一般与原词组同义,为了提高检索结果的查全率,我们可以采用与缩略相反的操作程序 ——补充还原,并将补充还原得到的词组作为原词的同义词,补充检索提问式。
例如:煤田勘探煤田勘探 +煤田 *地质第六步 增加限义词采用增加“限义词”的手段可以解决由于检索词一词多意而造成误检的问题。增加“限义词”的方法有两种,逻辑“与”和逻辑“非”。
例:将检索范围限定在煤田勘探方面,可以采取勘探 勘探 *煤田 (与)
要将其检索范围限定在煤田勘探以外,可以采取勘探 勘探 --煤田 (非)
第七步 组合一个检索课题在经过上述六个步骤之后,即可将它们组合成合乎需要的检索式。
分析检索结果,调整检索策略(一)
扩检时,调整检索式的主要方法
1、选全同义词并以,OR‖方式与原词连接后加入到检索式中。
2、降低检索词的专指度,从词表或检出文献中选一些上位词或相关词。
3、采用分类号进行检索。
4、删除某个不重要的概念组配。
5、取消某些过严的限制符。
6、调整位置算符,由严变松。
分析检索结果,调整检索策略(二)
缩检时,调整检索式的主要方法:
1、提高检索词的专指度,增加或换用下位词和专指性较强的自由词。
2、增加概念组配。
3、限制检索词出现的可检字段。
4、利用文献的外表特征限制。
5、用逻辑非来排除一些无关的检索项。
6、进行加权检索。
7、调整位置算符,由松变严。
一 数字图书馆概述二 国外数字图书馆的发展现状三 国内数字图书馆的发展现状数字图书馆概述
1,数字图书馆的定义
2,数字图书馆的特性
3,数字图书馆的基本功能广义 定义认为,数字图书馆与现有的印本图书馆没有任何关系,它实质上是,信息库,的概念,数字图书馆要解决的是海量信息的存贮与检索问题,特别是多媒体的检索问题。持这一观点的人通常是计算机界的专家。
数字图书馆定义狭义 定义认为,数字图书馆是在传统的图书馆基础上发展起来的,是印本文献的数字化与数字化资源的融合 。 数字图书馆要解决的是收集和建立数字化资源并有效地提供信息服务 。 持这种观点的人通常是图书馆界的从业人员 。
数字图书馆定义数字图书馆定义数字图书馆是提供资源 ( 包括专业人员 ) 服务 的组织,目的在于搜集,构建,存取,揭示,传递,保管大量的数字化作品,并保证其时间上的持久性,
从而可以被特定的群体方便而经济地加以利用 。
--美国数字图书馆联盟数字图书馆的特性数字图书馆至少应具有以下一些特征,海量存储的数字化资源,跨时空的网络化信息存取,智能化的搜索引擎和友好易用的用户界面,具有电子商务特征的用户服务模式,以及便于资源共享的组织结构 。
国外数字图书馆的发展现状
1,美国
( 1) 数字图书馆先导计划 ( DLI)
( 2) 美利坚记忆
2,英国:
( 1) 存取创新计划
( 2) 英国电子图书馆 ( eLib) 计划
3,法国
4,德国
5,日本美国,数字图书馆先导计划
1994年 9月,美国国家科学基金会
( NSF)、国家宇航局( NASA)和国防部高级研究署( ARPA)决定投资 2440万美元,
实施为期四年的六项数字图书馆先导计划。
这六个研究项目分别以六所科技领域及图书馆服务较好的大学作基地实验,用以改善数字化信息的收集、整序和存储方式,
并使其更快速地传递。
六所大学及其研究项目如下密歇根大学,多媒体数字图书馆伊利诺大学,工程和科学数字图书馆加州大学伯克利分校,环境科学数字图书馆卡内基梅隆大学,综合信息媒体数字图书馆斯坦福大学,集成数字图书馆系统加州大学圣塔巴巴拉分校,亚历山大数字图书馆到 1998年,六个分项已基本完成,
并开始投入第二阶段 ( DLI2) 的研究 。
DLI2计划从 1999年开始,持续 5年 。 五年中共向上述 6个单位提供 4000-5000万美元 。 重点提出 3个中心:以人为中心,以系 统 为 中 心,以 技 术 为 中 心 。
www.dli2.nsf.gov
美利坚记忆( American Memory)
美国国会图书馆的数字化项目。 1995年秋,
在第 104届国会的支持下,正式开始启动国家数字图书馆项目( National Digital Library
Program,简称 NDLP),该项目在 Internet上的正式名称为“美利坚记忆”。
http://lcweb2.loc.gov/ammem/ammemhome.html
,美利坚记忆”的建设目标,是在 6年之中将国会图书馆及所有公共图书馆、研究图书馆中的绘画、图书、
音乐、手稿、照片及运动画面转成数字图像,并通过广域网和有线电视网传送给各地用户。
美利坚记忆的建设目标截至 2001年,,美利坚记忆,已在因特网上提供 26个主题的八万多幅图片,提供了美国自 1774年至 1955年间的多类历史,文化,
史实性文献 。 其中包括从 1502-1820年西班牙占领到今天构成美国的北美概况的 600余幅地图和文件,一套美国独立战争文集,
2000幅地图,以及华盛顿,杰斐逊,威尔逊等总统的个人文件和讲话 。 其特点是以影像数据库为主,辅以全文本的说明 。
2000年,NSF提供了总计金额达 1,300
万美元的 29个基金项目 。 这些项目通过国家科学,数学,工程和技术教育数字图书馆 (NSDL)计划组织实施 。 其目的在于发展全时空的,权威,可靠和具有交互功能的教学资源和教学环境 。 每个项目提供的基金数额 从 16万美元到 84万美元不等,完成项目的时间跨度为两年 。
英国:存取创新计划英国国家图书馆作为“文献提供中心”,早在 1993年就宣布了,2000
年的政策目标”,即通过数字和网络技术使用户能最大限度地利用其馆藏。
同年,该图书馆提出了包括 20个项目的“存取创新计划”。
,存取创新计划”的目标是将通信技术、网络技术及多媒体技术等现代信息技术应用于图书馆领域,努力扩大图书馆的数字化馆藏,使全国用户可以不受时间和地理位置的限制,
方便快捷地获取所需的文献信息。
存取创新计划的目标英国电子图书馆( eLib)计划
eLib是英国高教系统建设电子图书馆的重要行动规划,它是由英国高等教育基金会下属的联合信息系统委员会( JISC)
提出和支持的,总投资超过 1亿英镑。其中启动资金为 1500英镑,另有 2400万英镑用于数据资源建设,5000万英镑用于网络设施建设。
eLib的建设内容包含 60个中小型研究项目 。 大约可分为以下几种类型:
网络资源存取领域数字化馆藏建设网络化出版
eLib的建设内容法 国法国是西方七国集团制订的全球电子图书馆项目的主页所在国,也是该项目的两个协调国之一。在世界数字化图书馆建设的热潮中,法国以其丰富的文化内涵和艺术品位,活跃于世界数字化图书馆建设的舞台,并在数字化图像处理及存储方面呈现出了自己的特色。
法国联合目录该项目的目标是将法国期刊目录,法国国家书目、法国高校联合目录等一并纳入此系统,到 1998年记录总数已达 830万条,年增加 30万条记录。
法国国家文献数据库法国国家文献数据库包括两个大型数据库。其中 BN-OPALE中主要收藏普通文献数据,
包括 1970年以来的图书数据,1960以来的连续出版物数据及 1994年以来的计算机文档数据。而 BN-OPALINE则主要收藏地图、照片、
多媒体等文献,包括 1987年以来的地图 9.4万幅,1989年以来的录音、视频、多媒体资料
29.5万条,1998年以来的照片资料 5.8万幅,
1991年以来的乐谱 4万条、硬币 2万种。目前,
这两个数据库已积累约 200万条数据。
文化精品数字化项目法国国家图书馆与各城市文化精品收藏馆通力合作,将原本分散于法国各地的古书的艺术插页用彩色高分辨率扫描制成光盘加以收藏。目前在
WWW网上分布的精品已达 1000幅彩色插图,共分为 17大类,每类均用略图方式导引读者浏览,并按读者所需可放大至满屏供详细研究。
德 国德国国家图书馆在德国数字图书馆的研究和建设中也处于主导地位。近年来,德国国家图书馆提出并与其它图书馆、出版商合作实施了多项电子图书馆项目,其中四个主要项目是:
( 1),德国图书馆,项目
( 2) 数字式,流放杂志,
( 3) 在线学位论文项目
( 4) 法律资源共享信息系统项目日 本日本的电子图书馆项目主要包括:
(1)国立国会数字图书馆项目
(2)文部省数字图书馆项目
(3)通产省数字图书馆项目
(4)邮政省数字图书馆项目国立国会数字图书馆项目日本国立国会图书馆的数字图书馆建设始于
1994年。 1998年 2月提出了题为,构建知识、情报、文化的新基础 ——为自由创造的情报社会,
的报告书。国会图书馆希望以此报告书为指导,
规划其数字图书馆建设。计划包括四个项目:
试验性电子图书馆项目儿童图书数字图书馆项目亚洲信息提供系统国会会议录全文数据库文部省数字图书馆项目文部省的主要任务是负责推动高校图书馆及其网络向电子图书馆转化。文部省主持的第二代数字图书馆项目 ——日本学术情报中心电子图书馆系统( ELIS)始于 1994年 12月,1997
年 4月初步完成。该项目在日本被认为是下一代信息服务系统的原型。 1995年 2月已开始在日本高校试运行。该系统是一个将日本的主要学术期刊向国内外传送的信息服务系统,现该系统已包括 29个学术团体的 62种学术刊物的电子版。
系统提供论文目录数据库查询功能。
通产省数字图书馆项目通产省着重开发电子图书馆通用系统及应用软件。从 1996年开始至今,通产省还负责研究和发展下一代数字式图书馆系统项目,目前已提出了数字式图书馆的体系结构,提出了多类检索方案。该项目由日本信息处理发展中心( JIPDEC)、日立、
富士通,NEC,IBM日本、东芝、三菱电子,OKI电子、理光等公司联合研制开发。
邮政省数字图书馆项目邮政省数字图书馆项目重点在于研究解决将 B-ISDN用于多媒体数字图书馆的相关技术问题。主要项目有三个:第一项是从 1993年开始的高级影像远程通信应用技术的研究与发展,将 B-ISDN用于电子图书馆领域所需的应用技术研究;第二项是 1992-1997年间为京都大学电子图书馆系统的进一步完善进行技术研究与协同试验;第三项是与国立国会图书馆合作的电子图书馆试验项目。
国内数字图书馆的发展现状
1.中国数字图书馆工程
2.国家科技图书文献中心网络服务系统
3.国家教育部 CALIS系统
4.上海数字图书馆项目
5.中科院国家科学数字图书馆项目
6.其他建设项目中国数字图书馆工程中国数字图书馆工程是运用现代高新技术所支持的国家级工程,涉及信息资源加工、
存贮、检索、传输和利用的全过程,是跨地区、跨部门、跨行业的宏大系统工程。 1998
年 7月,国家图书馆提出申请,同年8月,
文化部成立了工程筹备领导小组。 2000年 4
月,文化部召集了 21家成员单位参加的,中国数字图书馆工程建设联席会议,,标志着该项工程进入实质性操作阶段。
工程以,统一规划,制定标准,联合建设,资源共享,为建设原则,目标是在宽带 IP网上形成超大规模的,高质量的中文文献资源数据库群,支持国家整体创新体系的形成与发展,通过国家骨干通信网络系统向全国乃至全球提供服务,其总体技术水平与国际接轨 。
中国数字图书馆工程的建设目标工程计划分三个阶段进行,2000年为准备实验阶段; 2001年 -2002年为初步实用阶段; 2003年 -2005年为规模成长阶段。
建设的主要内容包括:数字资源建设、数字图书馆软 /硬件基础设施建设、应用系统开发、标准规范与法规的制定和推广、人才培养等。在各类数据资源组合的基础上,
采用联盟合作方式建设 。
中国数字图书馆工程的建设内容国家科技图书文献中心网络服务系统国家科技图书文献中心( National
Science and Technology Library,简称 NSTL)
成立于 2000年 6月 12日。中心按照理、工、农、
医四大支柱建设,由中国科学院图书馆、工程技术图书馆(由中国科技信息研究所、机械工业信息研究院、冶金信息标准研究院和中国化工信息中心组成)、中国农业科学院图书馆和中国医学科学院图书馆组成。
集中体现国家利益,根据国家发展需要,
收集和开发理、工、农、医等学科领域的科技文献信息资源,面向全国进行文献信息服务,
为促进政府科学决策、科学技术研究、人才培养、高新技术产业发展提供服务。这些科技信息机构收集的科技文献资源十分丰富,约占中国中央级信息机构收集总量的 80%。中心实行理事会领导下的主任负责制的管理体制。
中心的宗旨国家科技文献资源网络服务系统于 2000
年 12月 26日正式开通,向全国乃至全世界的科技工作者提供科技文献检索和全文提供服务。系统设有外文科技期刊、中文科技期刊、
外文会议论文、外文科技图书、中文会议文献和中文学位论文等 6个文摘数据库,开通时拥有的数据总量为 170万条,目前已发展到了约 2700万条数据。( www.nstl.gov.cn)
中心的资源中心的服务包括免费文献检索和有偿全文提供服务两个方面。所有互联网用户均可通过网络免费查询系统提供的各类型文献文摘数据库。如果需要全文,用户可联机向系统提出请求,原文收藏单位将在两个工作日(加急为一个工作日)内为用户提供(传真、邮寄或电子邮件)文章全文复印件(收取少量成本)。
中心的服务国家教育部 CALIS计划中国高等教育文献保障系统 (China
Academic Library & Information System,
简称 CALIS,(http://www.calis.edu.cn/)是经国务院批准的我国高等教育,211工程”
总体建设规划中两个公共系统之一。
1998 年 11 月,国家发展计划委员会正式批准了项目可行性研究报告,CALIS项目正式启动。
a.文献资源建设登上一个新的台阶。其中,
外文期刊品种要增加三分之一,使文献保障率达到中文满足 95%以上,外文满足 80%;
b.高校图书馆服务手段有较大改善。有超过 100种数据库上网服务,24小时不间断开机,
具有支持 100个用户同时检索的能力;
c.初步形成整体化的发展模式。改变过去高校图书馆分散发展、自我保障的模式,走资源共建、共知、共享的整体化发展之路。
CALIS的建设目标上海数字图书馆项目上海图书馆从 1997年开始启动数字化工程。
其数字图书馆建设可以分为三个阶段:打基础阶段、数字化资源整合阶段和全面提供服务阶段。目前已拥有九个资源库,分为两类,
一类以宣传教育和文化保存为主要功能,包括上海图典、上海文典、点曲台、古籍善本、
民国图书等;另一类以为科教兴市服务为主要功能,包括科技会议录、中国报刊、西文期刊目次、科技百花园等。
上图数字图书馆已经实现自建数字资源的统一管理和发布。在 体系结构 方面,
利用 IBM数字图书馆开发平台,将不同类的资源进行系统整合,保证了系统在管理大量的异构数据资源时,具有较好的灵活性和可扩展性。在 元数据 方面,提出了以国际主流元数据为基础的解决方案,资源描述方面以“都柏林核心元数据集”作为基本属性元素集,采用 XML方式封装所有元数据,解决了互操作性问题。
在 系统功能 方面,采用 JAVA等技术,
实现了对数据库的参量检索、全文检索和参量 /全文综合检索,实现了资源内容的动态发布,利用 JAVA所提供的跨平台操作的特性,实现了对数据库的多平台备份;在用户界面和访问管理 方面,采用通用模版动态生成页面的方式,使页面的设计维护工作简单易行,并通过可定制的检索实现了对整个资源库或特色资源的浏览。
国家科学数字图书馆项目国家科学数字图书馆 (Chinese Science
Digital Library,简称 CSDL)是中国科学院知识创新工程重大基础设施建设项目之一,
该项目的可行性研究报告在 2001年 10月 8
日中国科学院院长办公会议上讨论通过,
随即正式立项实施。
CSDL的建设目标依托 CSTNET网络,构筑科学研究和国家创新体系建设的科研文献信息支撑系统,
形成具有支撑科技创新、经济建设和持续发展能力的网络化、数字化文献信息平台;与国内外主要大型图书馆和信息机构互联,发展成为向国内外开放的国家主要信息基础设施之一。到 2005年前后,基本建成面向社会服务的国家科学数字图书馆。
CSDL的建设模式构筑以中科院文献情报中心为主节点,
以若干地区性或学科性文献情报机构为分支节点,连接研究所文献情报机构的数字化、分布式、可动态扩展的科研信息支撑平台。使科研人员无论何时何地,都可以通过网络查找和检索世界范围内最新出版的重要科技文献信息,并可通过网络及时、方便、快捷地索取和获得全文文献。
CSDL的建设内容
( 1)软硬件基础设施建设;
( 2)数字化信息加工系统建设;
( 3)印本及数字化文献资源建设;
( 4)特色科技门户网站建设;
( 5)远程文献服务系统建设;
( 6)数字图书馆应用软件系统开发;
( 7)数字图书馆标准规范建设与人才培养。
其他建设项目:
中美百万册书数字图书馆
http://www.cadal.net/cn/intro/xmbj/xmbj.htm
国家计委,教育部,财政部在 2002年 9
月下发的,关于,十五,期间加强,211工程,项目建设的若干意见,的文件中,将
,中英文图书数字化国际合作计划
( CADAL),列入,十五,期间,211工程,
公共服务体系建设的重要组成部分 。 CADAL
与,中国高等教育文献保障系统 ( CALIS),
一起,共同构成中国高等教育数字图书馆的框架 。
CADAL项目建设目标在,十五,期间,建设为我国高校教学科研服务的百万册图书规模的数字资源,建成 2个数字图书馆技术中心 (浙江大学,中国科学院研究生院 )和
14个数字资源中心 ( 北京大学,清华大学,浙江大学,复旦大学,南京大学,中国科学院研究生院,
上海交通大学,西安交通大学,武汉大学,华中科技大学,吉林大学,中山大学,四川大学,北京师范大学 ),形成一套成熟的支持 TB量级数字对象制作,管理与服务的技术平台,探索多媒体,虚拟现实等技术在数字图书馆中的应用,为数字图书馆建设与服务的可持续发展奠定资源和技术基础 。
CADAL项目的特点
1.数字化 100万册中英文图书 。 其中,将从美国数字图书馆联盟高校选择 50万册英文图书资源进行数字化转换; 50万册中文图书资源将突出高校教学科研的需要,兼顾保存和传承我国优秀传统文化的要求 。
2.采用开放式电子书标准,有别于目前国内电子书大都需要专用阅读器和低显示精度的状况,将大大方便读者的阅读,有利于数字资源的长期保存与进一步开发利用 。
CADAL项目的特点
3.建成 2个数字图书馆技术中心和 14个数字资源中心,在 CERNET上形成强大的分布式数字图书馆系统,将 有 效 发 挥 国 家 对
CERNET和 CALIS系统建设的投资效益 。
4.中美合资,合作研究开发数字图书馆技术,
确立完善的技术标准和规范,特别是形成一套成熟的支持 TB量级数字对象制作,管理与服务的技术平台,推动我国数字图书馆技术达到国际领先水平 。
上海交通大学图书馆数字图书馆
http://www.lib.sjtu.edu.cn/chinese/digital_libra
ry/subindex.htm
近几年来,上海交通大学图书馆经过,数字图书馆雏形,( 1996~ 1998) 和,数字图书馆试验基地,
( 1999~今 ) 的建设,在数字图书馆的体系结构,技术和服务上做了一些研究和探索 。
上海交通大学学位论文全文数据库 ——本校历年的硕士、
博士论文摘要,以及博士论文的全文高校学位论文库共建 ——北京大学、清华大学等全国著名大学在内的 83个 CALIS成员馆的硕士、博士论文教学参考书 ——满足本科生、研究生对基础和基础技术课教学参考书的需求上海交通大学出版物全文数据库 ——目前数据库中有上海交通大学学报自然科学版 等上海交通大学图书馆数字图书馆
http://www.lib.sjtu.edu.cn/chinese/digital_libr
ary/subindex.htm
音乐数字图书馆 ——有关中国民族音乐、交响乐的音乐资料,
可在网上播放乐曲机器人信息数据库 ——集机器人中英文期刊论文、专利、会议文献、产品信息于一库的系统科技创新 VOD视频点播 ——启迪学生科技创新意识,数据库主题为教学实验、科学与发现、科幻片等电子资源整合 ——可方便地找到所需要的电子书、数据库等和全文电子期刊及该期刊被 SCI,Ei等的收录情况上海交通大学志、年鉴 ——上海交通大学志( 1896—1996年)、
上海交通大学年鉴( 1997—2002年)
语言听音室 ——包括各种听力考试、试题、指南和口译教程等,
可同时浏览书籍和听音校重点学科网上图书馆 ——针对本校的重点学科建设,搜集网上相关站点,方便师生快速链接上海音乐数字图书馆
http://www.libnet.sh.cn/music/
网站由上海音乐学院和上海图书馆联合建设推出,希望利用合作双方在资源,专家方面得天独厚的优势,建设一个集资料性,研究性,普及性为一体的数字图书馆 。 目前试运行,希望全面征求广大网友,音乐爱好者,音乐专家的意见,团结各方力量,把,上海音乐图书馆,建设成一个音乐,门户,。
广东省立中山图书馆数字图书馆参考咨询服务中心
http://www.zslib.com.cn/diglib/zxjj.htm
数字图书馆参考咨询服务中心是由广东省立中山图书馆、超星数字图书馆、广东省公共图书馆等 20多个图书情报单位合作建立的公益性服务机构,其宗旨是以数字图书馆馆藏资源为基础,以因特网的丰富信息资源和各种信息搜寻技术为依托,为社会提供网上参考咨询和文献远程传递服务。
广东省立中山图书馆数字图书馆参考咨询服务中心
http://www.zslib.com.cn/diglib/zxjj.htm
数字图书馆目前拥有数字化图书 50万种,中文期刊论文 1000多万篇,博士、硕士论文 10万篇,外文期刊论文 500万篇,专利说明书 86万件,提供网上咨询、电话咨询和 OICQ实时在线咨询等三种方式的服务。
超星数字图书馆
http://www.ssreader.com
1.海量电子图书资源丰富的电子图书资源提供阅读,其中包括文学,经济,计算机等五十余大类,数十万册电子图书,300 万篇论文,
全文总量 4 亿余页,数据总量 30000GB,大量免费电子图书,并且每天仍在不断的增加与更新 。 为目前世界最大的中文在线数字图书馆;
2.阅读方便与快捷图书不仅可以直接在线阅读,还提供下载 (借阅 )和打印 。
多种图书浏览方式,强大的检索功能与在线找书专家的共同引导,帮助您及时准确查找阅读到书籍 。 书签,交互式标注,全文检索等实用功能,让您充分体验到数字化阅读的乐趣 。 24小时在线服务,不受地域时间限制;
超星数字图书馆
http://www.ssreader.com
3.先进的技术依托先进,成熟的超星数字图书馆技术平台和,超星阅览器,,给您提供各种读书所需功能 。 专为数字图书馆设计的 PDG电子图书格式,具有很好的显示效果,适合在互联网上使用等优点 。,超星阅览器,具有电子图书阅读,资源整理,网页采集,电子图书制作等功能;
4.十五万作者授权本着,尊重知识,尊重版权,的原则,超星数字图书馆在国内首家提出了一套电子图书版权解决方案,并大规模的开展与作者和出版社的签约授权工作 。 至今为止已经有十五万以上的作者将作品授权超星数字图书馆;
书生之家数字图书馆
http://www.21dmedia.com/default.jsp
软件主要功能:数字图书制作,文档
,一键转换,,数字图书交换,数字图书发布,共享管理,数字图书搜索,结合现有数字图书馆系统,结合书生 eBook平台,
提供数字图书馆服务 。
文学艺术 A 共 13308种 1月 12日新增 596种文学艺术 B共 6022种 1月 12日新增 278种计算机,通信与互联网 共 8530种 1月 12日新增 374种经济金融与工商管理 A共 11016种 1月 12日新增 468种经济金融与工商管理 B共 4443种 1月 12日新增 198种语言文化教育体育 共 15939种 1月 12日新增 669种教材教参与考试 A共 3741种 1月 12日新增 158种教材教参与考试 B共 22087种 1月 12日新增 926种生活百科 共 3217种 1月 12日新增 135种少儿图书 共 3040种 1月 12日新增 131种综合性图书与工具书 共 1867种 1月 12日新增 79种法律 共 5825种 1月 12日新增 244种军事 共 1289种 1月 12日新增 55种政治外交 共 2949种 1月 12日新增 125种社会科学 共 2945种 1月 12日新增 152种哲学宗教 共 3453种 1月 12日新增 146种历史地理 共 4538种 1月 12日新增 193种历史地理 共 4538种 1月 12日 新增 193种科普知识 共 1194种 1月 12日 新增 50种知识信息传媒 共 1745种 1月 12日新增 77种自然科学 共 8948种 1月 12日新增 375种农业科学 共 6929种 1月 12日新增 292种医药卫生 共 5017种 1月 12日新增 211种一般工业技术 共 1326种 1月 12日新增 56种矿业工程 共 543种 1月 12日新增 23种冶金与金属 共 831种 1月 12日新增 38种石化与能源动力 共 2492种 1月 12日新增 105种电工技术 共 1552种 1月 12日新增 67种轻工业与手工业 共 2529种 1月 12日新增 107种电子,电信与自动化 共 3130种 1月 12日新增 137种其他工业技术 共 1272种 1月 12日新增 55种建筑,交通运输与环境 共 8533种 1月 12日新增 375种
Thanks for
Listening!