2009-7-26 1
4-2 信息检索步骤信息检索步骤是根据检索课题的目的和内容要求,把合乎需要的文献或信息线索挑选出来所遵循的一般程序 。
一,课题分析,明确检索范围二,选择检索系统和检索工具三,确定检索点和检索途径四,构造检索式五,查找和分析检索结果六,调整检索方案,满足检索需要
2009-7-26 2
一、课题分析,明确检索范围
1,分析检索课题的实质
学科专业范围:确定检索课题的主题及其涉及的学科专业范围;
时间范围:确定该课题需要检索资料的年代范围;
语种范围:确定该课题需要检索资料的语言文种;
文献类型:文献媒体,出版类型等;
地理范围:确定该课题需要哪些国家或地区的资料;
查新,查准和查全等指标要求 。
2,机检服务单
Literature Search Request
Computer Search Service –User Search Questionnaire
2009-7-26 3
二、选择检索系统和检索工具
1,信息检索系统:指利用一定的设备和方法从文献,事实或数值记录集合中查找所需要的信息的系统 。 它由检索语言,技术手段和信息数据库组成 。
2,检索系统的具体分析:
从内容和时间上,考察检索系统和数据库对课题的覆盖面和一致性 。
从手段和技术上,考察手检和机检的结合 。
从价格和可获取性上,选择价格低廉,容易获取的检索系统和数据库 。
3,选择检索系统和检索工具:
,数据库指南,和,中国数据库大全,
Guide to the Reference Books,E·P·Shechy编辑,美国图书馆学会出版,
介绍约 14 000多种工具书,是目前世界上主要的指导使用工具书的工具书 。
机检系统特定的索引数据库 。
2009-7-26 4
三、确定检索点和检索途径
Access point是用以排列与存取文献或记录的数据单元。包括反映文献信息内容特征的检索点和反映文献外部特征的检索点两种。检索点是检索的入口,也可称为检索途径。最基本的检索途径有:
1、分类检索途径。根据文献信息所属的学科专业特征及其在特定知识分类体系中的特定位置查寻文献信息的检索途径。
2、主题检索途径。根据文献信息的主题特征和主题词的字顺次序查寻信息的检索途径。
3、名称检索途径。按文献的题名特征查找文献的检索途径。
4、著者检索途径。根据文献的责任者特征查寻文献的检索途径。著者目录、著者索引、机构索引、合同户索引、专利权人索引、著者所在单位索引等都是按责任者名称字顺编排的。
5、号码检索途径。根据文献的序号或代码查寻文献的检索途径。
6、引文检索途径。根据文后参考文献或引用文献的特征查找相关文献的途径。
2009-7-26 5
四、检索式的构造在手式检索时,每次检索只有从一个检索点出发,而且只能选择其中的一个属性值,检索范围比较窄。而机检系统适应多点、多属性值检索,对课题所涉及的方方面面,对包含的多种概念或多种限定都可以做出相应的处理,检索结果的精确度高。但是,计算机检索需要制订一个可执行的方案,这就是检索式的构造,它是检索策略的具体表现。
1、检索式
2、检索式构造方法
3、检索式构造技巧
2009-7-26 6
1、检索式
检索式是表达用户提问要求的逻辑算式,它将各检索单元 (其中最多的是能表达主题内容的检索词 )之间的逻辑关系,位置关系等用检索系统规定的各种操作符连接起来,成为机器可识别和执行的命令形式 。 通常由检索条件,检索词,布尔逻辑运算符,表示运算优先级的括号,结束号等组成 。
检索词是标引和检索文献时用以表达一定概念的语词或其他符号,
是构成检索式的最基本单元 。 包括描述文献外表特征的词和文献内容特征的词两个范畴,涉及规范词,规范化的代码和自由词 3
种形式 。 检索词应满足匹配的要求 。
检索词选择的基本原则,(1)主题词优先原则 ; (2)自由词适度原则; (3)基本词组配原则 。 总之,检索词应当具有全面性,专指性和一致性,尽可能切合检索课题,并对检索课题的实质做出全面,准确的描述 。
2009-7-26 7
2、检索式构造方法检索式构造方法是指对检索课题进行分析,选好检索词之后,使用系统规定的布尔算符及其他联系符号,按检索词之间的关系构造检索表达式的方法。
聚类组合法,是指对检索课题名称按序实施切分,删除,替换,聚类,
补充,增加,组合等操作,从而生成检索式的方法 。
⑴ 切分:把代表检索课题的语句以词或词组为单位进行划分 。
⑵ 删除:对经过切分后的检索语句中的不适宜作为检索词的词进行删除 。
⑶ 替换:对表达欠佳的词汇进行替换 。
⑷ 聚类:对切分出来的单元按语义进行同类合并 。
⑸ 补充:补充与原来的检索用词相关,相似或相同的各种词汇 。
⑹ 增加:采用逻辑与或逻辑非的方式对一词多义的情况进行限定 。
⑺ 组合:将检索用词按照检索课题的需要进行组合,以形成检索式 。
2009-7-26 8
3、检索式构造技巧
3,1 布尔检索,利用布尔代数中的逻辑算符,即在信息检索中能够表达概念之间关系的一类运算符 AND,OR,NOT等进行检索词语或代码的逻辑组配,以进行检索的一种方法和技术 。
3,2 截词检索,指计算机检索时,利用检索词的词干或不完整词形进行查找的检索技巧 。 它实际上是使用通配符或截词符来进行的模糊检索 。 截词检索可以分后截断,前截断和中截断 3种方式 。
3,3 限制检索:在检索系统中,通常采用一些缩小或约束检索结果的方法 。 限制检索主要利用系统规定的限制符,限制命令或限制字段进行的 。 其中,字段检索是限定检索词在数据库记录中出现的字段范围的一种检索方法 。 在检索系统中,数据库设置和提供的可供检索的字段分为主题字段和非主题字段两大类 。 题名 (TI),叙词 (DE)、
标识词 (ID)和文摘 (AB)等是主题字段;作者 (AU),文献类型 (DT)、
语种 (LA),出版年代 (PY)等是非主题字段 。 字段检索时,可以利用后缀符对主题字段进行限制,利用前缀符对非主题字段加以限制 。
2009-7-26 9
Boolean Search
操作符 逻辑关系 图示 表达式的含义
A OR B 逻辑或 字段值满足 A或 B或同时包括两者。
扩大检索范围,增加全面性。
A AND B 逻辑与 字段必须同时满足 A和 B。缩小检索范围,增加专指性。
A NOT B 逻辑非 字段值只包含 A,不包含 B或同时含有 A和 B的信息。排除不希望出现的概念,增加准确性。
A XOR B 逻辑异或 命中信息包含 A,也包含 B,但不包含同时含有 A和 B的信息。
A B
BA
A
A B
B
2009-7-26 10
Truncation Search
前 -后 -中截断
有限 -无限截断
①表示后截断至多 1个字符;
②表示后、中截断至多 3个字符;
③?加在一个检索词根后表示无限截断。
截断位置 前截断 后截断 中截断检索式?magnetic Market? Organi?ation
检索结果
Magnetic
Electro-magnetic
Thero-magnetic
……
Market
Marketable
Marketing
……
Organisation
Organization
……
2009-7-26 11
3,4 原文检索:以原始记录中的检索词与检索词间特定位置关系为对象的运算,它是一种可以不依赖叙词表而直接使用自由词的检索技术 。
原文检索运算类型可归纳为 4个级别:
⑴ 记录级检索:要求检索词出现在同一记录中 。
⑵ 字段级检索:要求检索词出现在同一字段中 。
⑶ 子字段或自然句级检索:要求参加检索运算的两个词出现在同一个子字段或同一个自然句中 。
⑷ 词位置检索,要求检索词之间的位置满足某些条件 。
3,5 比较条件检索:检索条件一般有大于,小于,等于和不等于 4种 。
3,6 加权检索:指结合检索词的权值查寻文献的一种检索技术 。
3,7 聚类检索:对集中在一起的内容相近的一类文献进行检索的方法 。
2009-7-26 12
Position Operators
算符 功能 表达式 检索结果
WITH (W) 两词相邻,按输入顺序排列。
Education (W) school 或
Education WITH school
Education school
Education schools
nW 同上,两词中间允许插入 n个词。
Education (1W) school Education school
Education schools
Education and music school
NEAR (N) 两词相邻,顺序可以颠倒。
Education (N) school 或
Education NEAR school
Education school
Education schools
School of education
nN 同上,两词中间可以插入 n个词。
Education (1N) school Education school
School of education
Education and music school
School of music and eduction
其他 PRE:两词相邻,按输入顺序排列; F:两个词同在一个标引字段中;
SAME:两个词同在一个段落中。
2009-7-26 13
五、查找和分析检索结果
查找文档:对文档进行查找,检出相关文献,并对所需要的文献原文进行索取 。
分析文档:包括检索结果的正确性,准确性,新颖性和完整性的鉴别等 。 检索结果的分析对整个科学研究具有非常重要的意义 。
需要说明的是,对文档进行检索,还必须掌握联机检索、光盘检索和网络检索等具体的操作程式。
2009-7-26 14
六、调整检索方案,满足检索需要
Step1
Step2
Step3
Step4
Step5
Step6
检索课题词表 主题分析选择检索系统确定检索途径制订检索式计算机处理数据库 编辑出版原文标引分析结果检验 印刷型缩微型电子型用户