知识发现与信息检索张小云
2004年 9月 1日
Tel:7885491 Email:zhangxy@ms.xjb.ac.cn
2
课程目标面对日益增长的 Internet的信息和文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息,并综合成章。
── 这就是本课程所希望解决的问题。
分三部分:
1.知识发现
2.信息检索基本概念
3.信息检索
4
第一部分:知识发现
5
知识经济时代,知识、知识创新与 知识资源利用问题 引起社会的高度关注。
知识 成为经济社会发展的首要资源,是衡量国家能力的主要因素。知识作为一种创造财富的战略资源,随着现代信息技术和国家信息化进程的迅速发展,以及科技、文化的进步在经济发展竞争中作用日益增强,人们对获取知识的能力和 利用知识的水平 得到了空前的提高 。
1知识发现
6
伟大的科学家牛顿说过:
,假如说我比别人看的略微远些,那是因为我站在巨人的肩膀上 。,
1知识发现
7
塞缪尔 ·约翰逊 ( Samuel Johnson) 说:知识分成两类:
一类是我们要掌握的学科知识;
另一类是要知道在哪儿可以找到有关知识的信息 。
Knowledge is of two kinds,We
know a subject ourselves,or we
know where we can find
information upon it,
1知识发现
8
知识资源利用创新 必然成为知识资源的高度共享乃至整个国家信息化发展战略的重要组成部分。
美国和西方发达国家均视其知识为国家发展的重要战略资源。
我国将,发展国家知识与创新体系,,“强化信息资源共享,作为基本国策,充分体现了这一战略资源及其知识资源共享的重要战略意义。
必须大力提高人们获取与利用知识的能力,在更大程度上、更大规模上、更大范围内实现知识资源的高度共享,充分满足人们在知识创新过程中对知识的需求。
1知识发现
9
传统文献信息资源的数量庞大,
类型多样,但开发利用是有限的 。
传统的文献资源共享主要是信息物质载体的共享,即文献的共享 。 这种共享由于受共享交易成本的限制,
只能是在一定时间,空间范围内有限的共享 。
1知识发现
10
现代计算机技术,网络技术的发展,改变了人们获取,利用和交流知识的方式,打破了知识信息传递的时空限制,使知识信息的交流,获取形式更为生动和直观,
为知识信息服务提供了崭新的信息环境,开辟了知识资源无限共享的新天地 。
1知识发现
11
网络信息技术加快了知识的传送,
拓展了知识领域的广度。网络环境下信息和知识服务已不再局限于一个固定建筑实体形态,其服务边界不断扩大并日益模糊化,知识提供与传播形式呈现多向性、共享性、交互性、实时性等特点,社会知识需求的复杂性日益增加,查询、利用知识信息的手段趋于计算机化、网络化。
1知识发现
12
知识的获得,组织与传播,通过异地共享和远程传播越来越显示出无比的优势 。 基于计算机网络的快速,
虚拟知识空间,可构建一个具有扩展和辐射能力的开放化,立体化的知识资源共享保障服务系统 。 在这种现代技术网络环境之中,可最大限度地满足人们对知识信息的无时空障碍的知识需求,实现知识资源共享所应达到的一种高级境界 。
1知识发现
13
为了使人们进入网络环境下知识资源高度共享的境界,多年来国内外专家,学者和企业在知识资源共享方式的设计和服务技术的实现上不断改革创新,陆续推出了不少新的知识产品和服务技术与模式:
1知识发现
14
知识挖掘,个性化服务,知识可视化等 。
,知识服务,理念,成为当今知识资源共享模式设计的核心指导思想 。 在这种共享模式之下,人们从知识资源中获取的不仅仅是一条条信息,而是一个个针对特定问题的解决方案,即知识 。
这样的知识资源共享方式,已经成为现代知识服务业所追求实现的高级境界 。
*
1知识发现
15
基于,知识元,水平上的全文关联的,
数据结构标准化的,人与资源可实时以多媒体信息交互的知识服务平台,无论数据库的物理位置何在,无论数据库专业性质和具体结构如何,都可使其在知识信息的内容上跨越数据库界限而浑然成为一体 。
人们在这个平台上可以用平台的各种个性化服务手段,从所有数据库中任意获取所需要的知识信息,并可在人与人的交流互动过程中得到新的知识 。
1知识发现
16
第二部分,信息检索基本概念
17
信息知识文献
2信息检索基本概念
18
2,1信息
定义 —— 物质存在的一种方式,一般指数据,消息中所包含的意义 。 可以使消息中所描述的事件的不定性减少 。
( *注:中国《情报与文献工作词汇基本术语》( GB48944-85) 有关信息的定义。
2信息检索基本概念
19
信息的概念十分广泛,围绕信息而出现的信息资源,信息技术,信息系统,信息产业,信息化社会和社会信息化等相关术语不胜枚举 。 那么,什么是信息,至今仍无确切,
统一的定义,站在不同的角度旧有不同的理解或解释 。
2信息检索基本概念
20
信息既不是物质,也不是能量,而是依附于自然界客观事物而存在,只要有物质存在,就有表征其属性的信息 。
2信息检索基本概念
21
信息的概念,实际上就是客观事物运动状态,时空特征,能量大小,质料系统特征,相互联系方式等一切反映事物客观属性的总称 。 从这种意义上看,信息比客观事物的属性更具一般性与普遍性 。
2信息检索基本概念
22
信息概念的实质在于它以某种编码形式储存或传输于某种介质之中,如储存在书本,纸张上的文字信息,记录在唱片,录音带上的声音信息,印制在画报,照片,录象带上的图像 ( 形 ) 信息,
计算机系统种的信息系统各种数字,数据信息等 。
2信息检索基本概念
23
例子:据说上古时期,诺亚的方舟在洪水中飘荡许久,当放出的飞鸽衔回一束橄榄,意味着带回了洪水已退的信息 。
2信息检索基本概念
24
从自然界角度看,表征物质的属性:地球昼夜的变化是一种信息,它反映出地球绕太阳自转的运动特性和状态;山的高度是一种信息,它反映出山的空间特性;树干的年轮是一种住处它反映了树木成长的时间特性 —— 树龄等等。
2信息检索基本概念
25
1) 按信息的加工程度划分
零次信息资源 —— 指尚未被记录下来,只是通过口头携带和传播的信息资源 。 零次信息资源的出现和传递带有极大的偶然性 。 其特点是鲜活,生命力旺盛 。
一次信息资源 —— 指经加工或粗略加工的原始信息资源,
如正在研究或创造过程中产生的信息,包括会议记录,论文报告,统计报表,专利等 。 其特点是比较零散,系统性不强,半包括所有的主要内容 。
二次信息资源 —— 指在一次信息资源基础上加工整理而成的信息资源,如文摘,索引,目录等,它们是引导和使用一次信息资源必不可少的工具 。
三次信息资源 —— 通过二次信息资源提供的线索,对某范围内的一次文献进行分析,研究加工而成的信息资源,
亦称三次文献,包括综述,述评,专题情报研究报告,百科全书,年鉴,指南,手册,词典等 。
2信息检索基本概念
26
2) 按信息表现形式划分
文字信息
图像信息
数值数据信息
语音信息
2信息检索基本概念
27
信息交流渠道:
正式渠道:信息是指由正式组织发布并经由正式组织渠道向外传播,
如官方新闻发布会,正式报告,国家统计部门发布统计信息等 。
非正式渠道:非正式渠道信息指从正式渠道以外获取的信息 。
2信息检索基本概念
28
2.2知识
是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述 。
提供某种经过思考的判断和某种实验的结果 。
2信息检索基本概念
29
知识的来源:
第一类是直接源于产生信息的客观事物;
第二类是通过信息载体或媒介 ( 文献,
电视,广播,他人等 ) 的传递,交流而间接获得 。
2信息检索基本概念
30
据经合组织 ( OCED) 出版的,以知识为基础的经济,报告对知识的分类:
1),知事 ( Know-what),,关于事实方面的知识,可理解为 Know-when,Know-where; 即 在 什 么 样 的 时 间
( Know-when),什么样的地点或条件下 (Know-where)
能解决什么样的问题;
2),知因 ( Know-why),,自然原理和规律方面的科学理论,知识生产是在专门研究机构如实验室和大学完成的;
3),知道怎样做的知识 ( Know-how),,做某些事的技艺和能力,称为技术情报和商业秘密,其典型是企业开发和保存于其内部的技术诀窍或专有技术;
4),谁以及是怎样创造知识的 ( Know-who),侧重创造思想,方法,手段,过程以及特点等的了解 。
2信息检索基本概念
31
2,3文献
记录有知识的一切载体 。
权威的定义主要
1) 是,文献情报术语国际标准 ( 草案 ),( ISO/
DIS5127),,为了把人类知识传播开来和继承下去,人们用文字,图形,符号,声频,视频等手段将其记录下来,
或写在纸上,或晒在蓝图上,或摄制在感光片上,或录到唱片上,或存贮在磁盘上 。 这种附着在各种载体上的记录统称为文献 。,
2) 国标:各种媒介和形式的信息集合,包括文字,声像印刷品,电子信息,数据库等 。
2信息检索基本概念
32
1) 按文献出版类型划分
a图书
b期刊
c政府出版物
d科技报告
e专利文献
f会议文献
g学位论文
h技术标准和规范
i产品样本说明书
j技术档案
2信息检索基本概念
33
按文献的存储载体分:
印刷型
缩微型
声像型
电子型
2信息检索基本概念
34
文献的构成要素,
A,文献信息是文献的内容
B,符号系统是信息的携带者
C,载体是符号赖以依附的,寄主,
D,记录方式是将文献的符号进入载体的方法和过程
2信息检索基本概念
35
2信息检索基本概念传递运用后事物运动知识新的信息信息产生 人脑有序化 用于实践文 献记录在载体上
36
知识是有组织的大量的信息,获得知识有赖于获得信息 ;
信息是知识得以形成和传播的中介,而不是知识本身,知识是经过精心研究、
领会后的有用信息,是人类对信息加工处理后的产物 。
2信息检索基本概念
37
第三部分:信息检索
38
3.1概述
3.1.1信息检索概念
信 息 检 索 Information Retrieval /
Access,是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略 。 从原理上看,它包括 存储与 检索 两方面 。
*
3信息检索
39
文献检索原理是:将检索提问标识与存贮在检索工具中的标引标识相比较,两者一致或信息标识包含着检索提问标识,则含有该标识的信息就从检索工具中输出;
对信息的著录是按一定规则对信息的外表特征和内容特征加以简单明确的表述,信息的标引是对其内容按一定的分类表或主题词表给出分类号或主题词;
检索过程则是按同样的主题词表或分类表及组配原则分析课题,形成检索提问标识,根据检索工具所提供的检索途径,从信息集合中查找与检索提问标识相符的信息特征标识的过程。(如下图)
3信息检索
40
3信息检索信息源信息的选择与收集信息特征标识语言检索工具匹配检索式提问检索结果数据库用户信息需求检索提问 检索提问式
41
What?
Where?
How?
42
检索是信息组织的反变换过程 。 信息组织的目的是将零散的信息组成一个有序的体系,检索的目的则是迅速从这个体系中搜寻所需的信息 。
3信息检索
43
信息检索分类
1),按存储和检索的内容划分为:
文献信息检索
数据信息检索
事实数据检索 Reference book
Database:
Numeric Database ( 数字)
Property Database ( 特性)
Textual-numeric Database( 文本数字)
Full-text Database( 全文)
Terminological Database( 专业)
Graphic Database ( 图形),..
*
3信息检索
44
对应于信息检索方法的操作主体,检索方法可分为:
手工检索;
机器检索 。
3信息检索
45
信息检索特征:
1) 有确定的目标;
2) 有一个可能的信息解的集合;
3) 有一定的线索 ( 即启发信息 ) ;
4) 搜索过程是针对一定的目标,遵循一定的线索,不断缩小搜索范围的求解过程 。
3信息检索
46
从信息资源管理的角度讲,信息检索是从已存储的信息资源中检索出与用户提问相关的文献,知识,事实,数据的逻辑运算和技术操作过程的总和,以文献检索为本源 。
3信息检索
47
也就是说,这是一种从大量集合的文献中查找出主题及其属性符合用户要求的情报过程 。 查找的对象不一定就是文献,有时也可能是正在研究中的项目,或正在进行某项工作的人员与机构,或图书馆的藏书目录等,但基本原理是一致的 。
48
信息检索能力 ( 信息技能 ),
—— 寻求有关新知识的能力
具体表现为以下 6种技能:
3信息检索
49
1)明确任务 ( Task Definition),了解问题的症结,确定所需信息和目的,分清任务的轻重缓急;
2)信息查询策略 ( Information Seeking
Strategies),了解各种信息源,能够作出评价并确定优先查找的次序;
3信息检索
50
3)查找和检索 ( Location and Access),
确定信息藏址,从信息源中找出信息;
4)信息利用 ( Use of Information),能够读懂 ( 或听懂,理解 ) 查出的信息,
了解信息在满足需求中的特定价值;
3信息检索
51
5)信息综合 ( Synthesis),能够组织信息,提供信息产品 ( 论文,报告等 ) ;
6)信息评价 ( Evaluation),评价查找结果和解决问题的过程 ( 效率 ) 。
3信息检索
52
检索者一方面要弄清文献的组织编排方式,
要具有,解构,能力;另一方面要善于分析提问,善于将信息需求转化为可检索的概念术语 。 这是一个双向分析和匹配的过程,是一个以满足用户信息需求为目标,
以用户提问为线索,不断缩小检索范围并查找用户所需信息的过程 。
3信息检索
53
信息检索方法:
检索方法的运用离不开各种检索工具
( 如目录,索引,文摘等 ),检索技术的利用则离不开相关硬件和软件 。 它们共同构成了联结信息资源体系和用户信息需求的纽带与桥梁 。
3信息检索
54
对应于信息组织方法,信息 检索方法可分为:
字顺(如题名、著者等)检索方法;
类号检索方法;
主题检索方法;
*
3信息检索
55
检索点,
主题 subject
分类 classification
著者 author
名称 title
号码 code,coden,..
3信息检索
56
主题途径:
是根据文献所论述的主题,利用主题语言编制的主题索引而进行的信息检索 。
主题索引大多按字母排列方式,因此,
检索也要用相应的方式 。
3信息检索
57
分类途径 (classification):
是根据文献所论述的主题内容,利用分类语言的学科专业体系进行的检索。大多数检索工具都采用分类语言作为正文编排体系的依据,分类目次通常不采用字顺排列类目和检索类目,而是按照学科专业角度的层层逻辑划分建立分类类目体系。检索时要选择合适的分类类目。
3信息检索
58
著者途径:
作者 ( Author) /团体著者 ( Corporate Author/ Authors’
Affiliation)
检索中,著者是一个广义的概念,是对文献内容负有责任的作者,编者,译者等,可以是个人,团体,机构,组织,
甚至还包括著者的单位 。 通过著者途径进行检索,主要可利用著者索引 。 所有著者索引都采用字顺排列方式,如果著者是个人,就以个人姓名字顺排列,如果著者是机构,
就以机构名称字顺排列 。 因此,检索也应该按相应的途径 。
3信息检索
59
题名途径 (Title),
检索中,文献题名是一个广泛的概念,
包括文献篇名,图书书名,期刊刊名 。
常见的题名索引主要有篇名索引,书名索引,刊名索引等 。 题名索引通常按字顺排检方式,因此,检索也应该采取相应的途径 。
3信息检索
60
序号途径:
许多文献除普通外表特征外,还具有序号特征,
如,专利文献有专利号,标准文献有标准号,馆藏文献有索书号 。
序号索引一般按照文献序号的大小顺序排列,如文献序号纯粹由数字组成,就按数字大小生序排列,如果序号包含数字和字母,就按数字大小和字母顺序升序排列 。 如果前面是字母后面是数字混合组成的序号,就先按字母顺序排列,字母相同,再按后面的数字大小排列 。 因此,序号检索也应按照同样方法 。
3信息检索
61
直检法:专业核心期刊跟踪
常规法,顺查法,倒查法,抽查法
追溯法,参考文献,引用目录
综合法,分段法,循环法,交替法
3信息检索
62
常用法
– 顺查法:
从远及近查,用于了解某一事物发展的全过程,
– 倒查法:
由近及远查,重点为近期
– 抽查法:
查找某一段时间的文献
3信息检索
63
检索词 /语言,Searching Language & Thesaurus
描述检索系统中信息特征与表达用户信息提问的一种专门语言,是为沟通文献信息用户和文献信息之间的语言,理论上讲,是用于文献标引和检索提问的约定语言。
非规范词 (非受控词 自由词 ) uncontrolled,free-
term/自然语言 natural Language
规范词 (受控词 ) controlled/人工语言
Artificial Language
主题词表
3信息检索
64
按照表达文献主题概念的语词形式,有分类语言和主题语言。
描述文献信息内容特征的语言,
标题词语言 Subject Heading
单元词语言 Uniterm
叙词语言 Descriptor
关键词语言 Keyword
分类语言
3信息检索
65
例如规定,aircraft 表示,飞机,而不用
airplane;plane;aeroplane。
作到文献存储和检索的一致性。这些规范化词的集合构成了词表。
3信息检索
66
检索效果
查全率 R (Recall ratio)
R=检出的相关文献量 /检索系统中相关文献总量
*100%
查准率 P (Precision ratio)
P=检出的相关文献量 /检出的文献总量 *100%
3信息检索
67
检索方式
(1)命令检索 (command search)
算符 (operator)
检索式 (statement formula)
(2)菜单检索 (menu search)
提示 选项 填空
3信息检索
68
检索技术
(1)常用算符
逻辑算符
(boolean operator)
3信息检索
69
常用的布尔逻辑算符有三种,
分别是逻辑或 OR,+
逻辑与 AND,*,+
逻辑非 NOT,-。
3信息检索
70
( 1)逻辑或,OR”
逻辑或 ( A OR B) 检索出凡含有检索词 A
或者含有检索词 B或者同时含有检索词 A
和 B的信息资源 。
逻辑或,OR”可以扩大信息的检索范围,
使用它相当于增加检索词主题的同义词与近义词,能提高检索的查全率 。
*E 概念大小,关系
3信息检索
71
( 2)逻辑与,AND”
逻辑与 ( A AND B) 检索出同时含有检索词 A和检索词 B的信息 。
如果 A和 B无关,则没有命中文献,Q=0;
如果 A和 B有一定相关性,则有 M> Q> 0,
或 N> Q> 0;
这表明,逻辑与,AND”可以缩小信息的检索范围,提高检索的查准率 。
*t
3信息检索
72
( 3) 逻辑非,NOT”
逻辑非 ( A NOT B) 检索出含有检索词 A而不含有检索词 B的信息资源 。
如果 A与 B无关,则 Q=M;
如果 A与 B有一定相关性,则 Q< M;
如果 A与 B 密切相关,则当 M> N时,Q=M-N,当 M< N时,
Q=0;
因此,逻辑非,NOT”可以用来排除不希望出现的检索词,它与逻辑与,AND”的作用类似,能够缩小命中信息的范围,提高检索的查准率 。
*W
3信息检索
73
信息检索过程和检索策略
无论是作为一种方法还是一种技术,信息检索都表现为一种过程,该过程始于用户的信息提问而终于检索结果的输出 。
检索策略 是针对一定的检索目标,围绕信息检索过程而制订的具体实施计划或实施方案,其实质是对检索过程的科学规划,与检索方法和检索技术相比较,检索策略更为具体,更为实用,更富于可操作性 。
3.信息检索
74
3信息检索开始提问弄清(明确)问题的实质提问的分析综合处理用情报检索语言表达提问,编制提问检索式和检索提问式切题文献和信息的检索形成检索结果显示检索结果分析结果与提问的相关性结果不相关相关
75
维药老鼠瓜抗风湿性关节炎有效部位的新药研究
The study concerning with Capparis
spinosa L,as a new medicine
76
检索词
#1 老鼠瓜 或 槌果藤 或 野西瓜
Capparis spinosa L.
#2 类风湿性关节炎
Rheumatoid arthritis or RA
检索式
#1 * #2
77
聚合物光漂白及其在光波导器件制备技术中的研究
Study on photo bleaching
of polymer and its
application in fabricating
of optical waveguides
78
检索策略:
检索词:
#1光漂白 photobleaching;
#2聚合物 polymer(PMMA/DR1,Poly-3BCMU和
polydiacetylene);
#3波导光栅 waveguide grating;
#4,非线性光学 the third order nonlinearities;
#5单光束扫描法 z-scan;
#6,双光束扫描法 two beam scan technique
#7非线性 定向耦合器 nonlinear directional coupler;
#8 光栅耦合器 chirped grating coupler;
检索式:
#1 * (#2+#3+#4+#5+#6+#7+#8)
79
精氨酸基因工程菌中试发酵工艺研究检索词:
1,精氨酸 arginine
2,基因工程菌 gene-engineering strain
3,黄色短杆菌 brevibacterium flavum
4,大肠杆菌 escherichia coli
5,合成 component or synthesis or synthetiae
6,发酵 fermentation
检索式,1*( 2+3+4+5+6)
80
计算机检索的特点
信息量大
信息及时
检索功能强
检索效率高
3信息检索
81
确定检索点 /词检索课题 用户主题分析选择检索系统选择数据库制定检索式计算机处理 结果检验词表
N Y
82
数据库检索
网络资源检索
3信息检索
83
3.2数据库检索
3.2.1数据库的基本概念数据库的定义,
至少由一种文档组成,能满足特定目的的或特定数据处理系统需要的数据集合,
3信息检索
84
3.2.2.数据库的类型
(1)参考数据库
书目数据 (bibliographic database)
目录数据库 (catalog database)
文摘索引数据库 (abstract/index
database)
指南数据库 (directory database)
3信息检索
85
(2)源数据库 (source database,data bank)
数值数据库 (numeric database)
文本 -数值数据库 (text-numeric database)
全文数据库 (full-text database)
3信息检索
86
有 3.2.3四个必要的层次:
字段 (field)
记录 (record)
文档 (file)
数据库 (database)
3信息检索
87
1.字段(数据项)
是组成数据库的最小基本单位。
它的作用是描述一个数据处理对象的某些属性。
如书目型的数据库,字段可为文献的篇名,
作者,作者单位,刊名等。
88
2.记录
与某一数据处理对象有关的一切数据项构成了该对象的一条记录。
如书目型数据库,一条记录反映了一篇文献的相关信息
89
例 2 书目型数据库中的记录
Automatic detection of lung cancers in chest CT images
by the variable N-quoit filter Miwa,Tomoko; Kako,Jun-Ichi;
Yamamoto,Shinji; Matsumoto,Mitsuomi; Tateno,Yukio; Iinuma,
Takeshi; Matsumoto,Toru Author Affiliation,Knowledge-
Based Info,Eng,Dept.,Toyohashi University of Technology
Source,Systems and Computers in Japan v 33 n 1 January
2002 p 53-63,In English
Abstract
90
内容 Content
范围 Coverage
时效 Currency
费用 Cost
选库的 4C原则,
91
中文数据库的类型
1)按提供信息加工的层次分
参考数据库
包括书目数据库、指南数据库。
源数据库
包括全文数据库、数值数据库、多媒体数据库。
2)按是否需要在线使用分:
光盘数据库:单机使用光盘、光盘镜像。
网络联机数据库
92
《万方数据资源系统》
数据库介绍
93
1)概况
是由中国科技信息研究所、万方数据集团公司开发的网上数据库联机检索系统。
2) 收录特色
是一个以科技信息为主,集经济、金融、社会、文化、教育、卫生等各行业信息于一体的信息服务系统。它包括 110余个数据库,
归属 5个子系统,内容涉及自然科学和社会科学各个专业领域,收录范围包括期刊、会议、文献、题录、报告、论文、标准专利、
连续出版物,最新科技成果,称得上是一个拥有海量信息的中文信息检索系统。
94
3.3网络资源检索基础
95
因特网基础
96
进入 90年代后,随着网络技术的发展,尤其是互联网的迅猛发展,使计算机检索进入一个崭新的时期。
检索方法更简单,检索结果更全面 ;
经过 40多年的发展,从早期的书目信息到后来的全文本信息,到今天的网络与多媒体信息,网络信息资源已成为现代社会不可缺少的资源财富 ;
其处理技术从简单的字段与关键词检索到全文检索,再到今天成为网络主流的超文本与多媒体处理。 处理技术的演进与发展,一方面使网络信息资源的内容从单一的书目到图文并茂的多媒体,更富有吸引力和使用价值;
另一方面,超文本的广泛利用改变传统的信息组织的线性方法,使电子资源的组织更接近于“自然”,大大方便了用户的使用,使电资源的利用变得非常容易,用户不需要太多的检索知识与技术。
97
按提供的内容网络信息资源可分为:
1,参考型数据库,指引用户到另一信息源以获得原文或其他细节的一类数据库。包括各种书目数据库和引文数据库。
这种数据库具有参考和评价的功能,多用于查新、开题。
如,SCI,EI,维普的中文期刊数据库 ……
2,全文数据库,指存储文献全文或其中主要部分的数据库。
如新闻消息全文库、法律法规全文库、人大报刊资料库、
博硕论文全文库等。
3,事实型数据库,直接提供事实或数值的数据库。如:万方的企业产品数据库、彼得森大学指南等。
4,电子图书,计算机利用计算机检索并下载阅读的图书。如:
书生之家、超星数字图书馆、各种数字图书馆等。
5,电子期刊,直接在网上就可以检索和阅读的期刊。如:万方数字化期刊,中国期刊网全文数据库,science
online等
6,电子报纸,如:人民日报的网络版。
7,其它类型,如软件,新闻等
98
网络信息资源的特点
以网络为传播媒体
以多媒体为内容特征
以现代信息技术为记录手段
数据结构县通用性、开放性和标准化
高度的整合性,便于多种媒体一体化
交互性能增强 动态性、缺乏管理结构复杂,分布广泛
99
常用网络类型代码:
com 商业机构
mil 军事部门
edu 教育机构
net 网管组织
gov 政府部门
org 非营利组织
int 国际组织
100
WWW检索工具的含义及类型
广义 一种基于环球网(WWW)
的信息查询系统。包括信息存储、
信息管理和信息检索。
狭义 一种为搜索环球网( WWW) 上的网页而设计的检索软件。
101
按检索功能分:
主题指南 /目录( Subject Guides or
Directory) 按某种分类规则建成树状等级目录,
字顺法,时序法,地序法 。
由人工干预,保证了查准率,但查全率较低 。
如 Yahoo
检索引擎 ( Search Engines)
通过 Robot,Spider等自动跟踪标引软件搜寻网络资源。它不需要人工干涉,查全率较高,
但查准率较低。
如 AltaVista
102
按检索内容分:
通用检索工具是综合性的信息检索系统,它往往基于检索词去匹配相关的内容 。 时常也会因检出内容太泛而无法一一过目 。
如 Yahoo,Go,AltaVista等 。
专业检索工具是专业信息机构根据专业需求,将 Internet上资源进行筛选整理,重新组织而形成专业信息检索系统,专业针对性较强 。
如 Medical World Search,Medical Matrix等 。
103
Web通用检索工具的使用
104
Yahoo! http://www.yahoo.com
1994.4由美籍华人杨致远等创建。
120万个网址; 14个主题逐级细分。
有 150个编辑人员维护。
鼓励用户利用联机表格递交自己的网址。
目录?提供多项服务 (购物、免费邮件、
拍卖、聊天和新闻等) 的门户
105
简单检索
分类目录点击检索检出结果,网址
– 例:查找数字化图书馆
106
107
108
109
高级检索
点击 Advanced Search
3信息检索
110
检索方法:
1.检索栏输入:
必须检索 Hepatoma +diagnosis
排除检索 Liver - kidney
短语检索,kidney failure”
右截词检索 cap*
3信息检索
111
2.其它方式选择:
逻辑检索( and,or);
区域选择 ;
时间选择等。
3信息检索
112
Google(http://www.google.com)
"手气不错 " 按钮自动将您带到 Google推荐的网页。您无须查看其他结果,省时方便。
不支持,or”,空格即代表 and
不支持,*”
对大小写不敏感
专用词语上加上双引号
支持,-” 功能,用以有目的地删除某些无关的网页,但减号之前必须留一空格。
3信息检索
113
中文搜索引擎
1,雅虎中文
http://cn.yahoo.com (简体中文 )
2,搜狐
http://www.sohu.com.cn
3,新浪网
http://www.sina.com
4,Google中文
http://www.google.com
114
网络资源查找
图书
期刊
技术报告
专利
会议文献
学位论文
标准文献
115
网上图书资源
网上中文数字化图书超星数据图书馆网址:
书生数字图书馆网址,http://www.21dmedia.com
中国数字图书馆网址,http://www.d-Library.com.cn
网上外文数字化图书
NetLibrary e-book
网址,http://www.netlibrary.com
Springer Link
网址,http://link.springer.de/
116
网上期刊文献资源中文全文期刊重要数据库:
重庆维普全文数据库 中国 期网网址,www.tydata.com
万方数据库网址,http://www.wanfangdata.com.cn/
中国期刊网网址,www.cnki.net
117
118
中国期刊网
Http://www.cnki.net
119
中国期刊网 http://www.cnki.net
万方数据资源系统
http://www.wanfangdata.com.cn/
121
网上科技报告
国研报告 http://www.drcnet.com.cn
中国商业报告 http://www.bjinfobank.com
U.S.Department of Energy 美国能源部科学技术信息网站。 http://www.osti.gov.
Scientific and Technical Report Collection
美国国防部 (Department of Defense)提供的科技报告,涉及国防极其相关领域 。 Http://www.dtic.mil
NASA Scientific and Technical Information
Program NASA(National Aeronautices & Space
Administration)提供的有关航空航天方面的丰富的科技报告全文。 http://www.sti.nasa.gov
National Technical Information Service(NTIS)
提供美国政府工作报告 。 http://www.ntis.gov/
122
网上专利文献国内专利文献中国知识产权局 http://www.sipo.gvo.cn
中国知识产权出版社 http://www.cnipr.com
北京经济信息网 http://www.beinet.net.cn
中国期刊网站 ( CNKI) http://www.bj.cnki.net
万方数据库 http:// www.wanfangdata.com.cn/
中国台湾专利 http://twp.apipa.org.tw
3信息检索
123
国外专利文献美国专利检索 http,//www.uspto.gov
欧洲专利 http://ep.espacenet.com
世界知识产权组织 http://www.wipo.int
日本专利 http://www.ipdl.jpo.go.jp.
其它国外专利网站可参考知识产权网站的链接
124
会议文献资源
国内会议文献
国内会议文献
– 万方数据库 (本校镜像站) IP:202.113.6.246
天津工业大学 IP:211.81.27.20
国外会议文献
– IEEE (600种 )
– ACM
– AIP
检索会议文献的工具
– ISTP
– EI-VILLAGE
– INSPEC
利用学术团体网站获得 会议文献信息
125
126
电子词典与在线词典
随着信息技术的发展,逐步出现了光盘版和网络版等使用方便的工具书,尤其是随着 Internet的发展,互联网上涌现出越来越多的各种类型的网络版工具书。
以下举例部分在线词典的网址。
127
洪恩在线双语词典,www.englishcn.com
在线成语字典,www.zdshop.com/chengyu.asp
法律词典:
www.lawtran.com/gbk/Glossary.aspx
德汉词典,http://balder.prohosting.cn/~zidian/
林语堂当代汉英词典:
http://hermes.arts.cuhk.edu.hk/Lexis/Lindiet
吕氏网上词典,www.lexiconer.com
韦博斯特在线词典,www.m-w.com
128
多媒体百科全书:
微软电子百科全书在线:
http://encarta.msn.com/EncartaHome.asp
大英百科全书,www.eb.com 是大英百科全书公司推出的网络化服务,其收录比印刷版多,目前有 72000多篇文献可供检索或浏览 。 用户可申请一周的免费试用期 。
网上百科全书,www.encyclopedia.com 提供了超过 5万篇全文及和电子图书馆中几百万篇文献和图片的链接 。
世界百科全书,www.emulateme.com/E-Conflict.
东方百科全书,http://I-cias.com/e.o/index.htm,北非和中东国家的唯一一部网络百科全书,信息免费,周更新 。
中国大百科全书出版社网站,www.ecph.com.cn
百科全书网,www.db66.com/about/bkqs.asp 提供各类百科全书链接通过 INTERNET实现国际联机检索
STN
http://stnweb.cas.org/html/english/a_
index.html
3信息检索
130
国际 STN(The Scientific and Technical
Information Network International)即国际科学技术信息网络系统的简称。
SIN系统拥有 200多个数据库,已成为著名的大型联机检索系统之一;
它涉及的专业范围有:化学、化工、生物、医
学、数学、物理、能源、冶金、建筑、会议论文、农业、药学专利等。
131
布尔逻辑算符:
and(逻辑与 ),or(逻辑或 ),not(逻辑非 )。
132