第四讲 信息检索语言
?分类检索语言
?主题检索语言
?引文检索语言
分类检索语言
?概述
?中文图书分类表
?西文图书分类表
?俄文图书分类表
?日文图书分类表
概述
? 分类检索语言是由许多类目按一定的原则, 以列表的
形式组织起来, 并通过标记符号来代表各级类目和固
定其先后次序的一种检索语言 。 它可分为等级体系分
类语言和分析 -综合分类语言,
? 图书馆、信息研究所、档案馆等与信息相关的机构在
长期的实践过程中建立了分类检索语言体系,编制了
大量的分类表,这些分类表是我们查找信息的重要途
经。
? 分类检索语言能较好的体现学科的系统性, 反映事物
之间的联系, 把内容性质相近的事物聚集在一起, 较
好地满足了按学科检索的需要, 也即族性检索功能较
强 。 其不足是如不熟悉分类检索语言的人使用起来较
为困难, 可能会出现漏检;新学科, 边缘学科等不能
及时反映 。
中文图书分类表
?, 中国图书馆图书分类法, ( 简称中图法 ), 它由中
图法编委会编辑, 1975年第一版, 1980年第二版, 现
在使用的是 1990年第三版, 它把知识, 信息分为五大
部类:即马克思列宁主义毛泽东思想, 哲学, 社会科
学, 自然科学, 综合性图书;二十二大类;四万多条
类目 。 它属于等级列举式的分类表 。 附,中图法简表
西文图书分类表
? 国际十进分类法, ( Universal Decimal Classification
简称 UDC),它是由比利时学者鲍尔,奥特勒( Paul
Otlet)和亨利,拉芳 (Henri La)编辑( DDC),初版于
己于 1905年,现在使用的是国际第三版,有 23种文本,
六十年代末被称为世界信息交流语言,它属于分析综
合分类语言。它把知识、信息分为十大门类,近二十
万个类目,是所有分类法中设类目最多者,科技部分
设类尤详。
UDC简表(一)
Main tables
? 0 Generalities
? 01 Bibliography and bibliographies,Catalogues
? 02 Librarianship
? 030 General reference works,Encyclopaedias,
Dictionaries
? 1 Philosophy
? 11 Metaphysics,Fundamental problems
? 3 Social sciences
UDC简表(二)
? 4 (Vacant; linguistics transferred to 81)
? 5 Mathematics and natural sciences
? 54 Chemistry,Crystallography,Mineralogy
? 6 Applied sciences,Medicine,Technology
? 62 Engineering,Technology in general
? 7 The arts,Recreation,Entertainment,Sport
? 8 Language,Linguistics,Literature
? 9 Geography,Biography,History
俄文图书分类表
?, 苏联图书馆书目分类法,
( Библиотечно -
Библиографическая
Классификация 简称 ББК ) 自 1961年
至 1968年 分 二十 五 卷三 十 个分 册 出版, 1970年至
1972年出版节略本, 共五卷, 分为二十一个大类 。
日文图书分类表
?, 日本十进分类法,, 它是由日本著名的图书馆学家
森清编辑, 1929年第一版, 现用 1978年新定第八版,
主要类目如下:
? 0 总记 6产业 600产业
? 1哲学
? 2历史 7艺术
? 3社会科学 8言语
? 4自然科学
? 5技术 9文学
? 6产业 600产业
主题检索语言
?概念
?标题词表的构成原理
?其它类型
概念
? 直接用语词作为表达主题概念的标识, 按主题标识的
字顺排列, 用参照系统等表达概念之间的相互关系的
一种检索语言 。
? 每一种事物都可能涉及到许多学科的知识, 分类检索
语言不能满足这类查找需求, 而主题检索语言却能较
好的解决这类问题 。 运用主题检索语言编制的检索词
表称之为主题词表 。
标题词语言的构成原理
? 标题词语言的构成原理可归纳为:按主题集中文献;,
用经过规范化的语词 ( 标题词 ) 直接标引文献主题;
用参照系统间接显示主题之间的相关关系;用字顺序
列直接提供主题检索途径 。 任何一个标题词, 都是一
个完整的标识, 可以独立地标引一个文献主题 。
? 标题词表由以下三个部分组成,1.编制说明:指出本
表的编制经过, 收录标题词的学科范围, 选词形式,
标题形式, 参照系统, 各种符号的意义, 标引及排列
规则等 。 2.主表:是标题词表的正文, 包括全部标题
词和非标题词, 按字顺排列, 并有参照体系和注释 。
3.副表:也称标题细分表, 副表中的标题词一般只能
用作标题词的限定词, 也称副标题词或限定词 ( 如地
区, 人物副表 ) 。
其它类型(一)
? 单元词法, 也称之为元词法 。 元词指在概念上不能进
一步细分的最小的语词单位 。 元词法主要基于所有完
整, 复杂的概念都可通过元词组配而来这样一种认识,
但其过于强调语词的最小化, 从而降低了它的实用性 。
? 关键词法:关键词是从文献的题目, 正文, 摘要中抽
取出来用以表示文献主题的具有特别实质意义的语词,
它不加规范, 没有词表 。 其优点是易标引, 快速, 直
观, 缺点是语词不规范, 误检率和漏检率都很高 。 因
此, 关键词法适合于随意性较大的浏览性查找或是对
查准率要求不高的查找 。
其它类型(二)
? 关键词法目前已得到广泛的应用, 出现了多种关键词
索引形式, 大体可分为两类:一类是带上下文的关键
词索引, 包括题内关键词和题外关键词索引等;另一
类是不带上下文的关键词索引, 包括单纯关键词索引,
词对式关键词索引和简单关键词索引 。
? 题内关键词索引 。 也称上下文关键词索引, 这种索
引将文献标题中的关键词和非关键词都保留, 并保持
标题原文的词序, 使每一个关键词都有一次机会轮流
排到作为检索词的固定位置 ( 如中栏开头 ), 将处于
固定检索位置的关键词按字顺排列起来, 每条款目附
文献地址 。 这样构成的关键词索引便成为一种检索工
具 。 如美国出版的, 化学题录, ( Chemical Title) 。
?
其它类型(三)
? 题外关键词索引 。 这种索引是将文献标题中的关键词
和非关键词都保留, 并保持标题原文的词序, 同时轮
流地将每个关键词, 抽出, ( 实际上在标题原文位置
仍保留或用, *” 号代替 ), 置于标题左方 ( 或左上
方 ) 的检索词位置, 并将处于检索词位置的关键词按
字顺排列 。
? 单纯关键词索引 。 这种索引是将表征主题内容的关
键词抽出组成索引款目, 然后将索引款目中的关键词
轮流移到左端 ( 或左上方 ) 作为检索词, 并按字顺排
列, 每条款目后附文献地址 ( 文摘号 ) 。
? 简单关键词索引。这种索引的索引款目只有一个关
键词。后面附全部相关文摘号,非常简单。
其它类型(四)
? 叙词法:叙词是指从文献中抽出的且规范化了的用以
表达文献主题的单义词或代码。叙词法就是采用叙词
表述文献主题,编制检索系统的一种方法。叙词法吸
收了上述各种方法的优点,具有直观、专指、灵活、
查找方便、迅速准确等特点。用叙词法原理编制的检
索词表称之为叙词表,它有综合性的词表,如, 汉语
主题词表,,, 纽约时报主题词表, ( The New
York Times Thesaurus of Descriptor,A Guide for
Organizing,Cataloging Index and Searching
Collections of Information on Current Events) ;专业
性的词表,如,美国数学会 Mathematical Review
1991 Subject Classification
引文检索语言
?概述
?构成
?特点与功能
?查找过程
概述(一)
? 引文法是利用文献的引用和被引用的规律整序文献,
通过著者的引证反映论文之间, 学科之间关系的一种
方法 。
? 美国信息管理专家尤金,加菲尔德 ( Eugene Garfield)
1961年首次使用这一方法编制了著名的, 科学引文索
引, ( Science Citation Index,1961-,bi-m,简称 SCI) 。
SCI使得科学论著的学术水平及其重要价值有了一个
较为科学的评价依据 。
? 近 四 十 年间, 由加 菲 尔德 创 立的 费 城科 学 信息 社
( Institute for Scientific Information,简称 ISI) 出版了
三种引文索引, 除 SCI外, 尚有, 社会科学引文索引,
概述(二)
? ( Social Science Citation Index,1972-,3/yr,简称
SSCI),, 艺术与人文科学引文索引, ( Arts and
Humanities Citation Index,1978-,3/yr,简称 A&HCI),
从 上 述 索 引 又 派 生 出, 计 算 数 学 引 文 索 引,
( CompuMath Citation Index,1985-,3/yr,简称
CMCI ) 。 在我国, 1995年由中国科学院文献信息中
心编制了, 中国科学引文索引, ( Chinese Science
Citation Index,简称 CSCI)
构成
? 引文索引由, 引文索引,,, 机构索引,,, 来源索
引, 及从文献篇名中每次选取两个关键词经过排列法
处理的, 轮排主题索引, 组成 。, 科学引文索引,
另有, 专利引文索引,,, 计算数学引文索引, 另有
,专题研究索引, 。
特点与功能
? 它通过已知论著查找出相关引用论著, 反映不同时期
新旧论著之间的渊源关系, 能揭示旧论著对新论著的
影响, 新论著对旧论著的反馈 。
? 能查出发表在相关学科以外的杂志上的论著, 反映学
科之间的交叉渗透关系, 颇有助于检索边缘科学论著 。
? 将引文本身作为检索入口, 语词稳定, 易查, 较之分
类检索语言, 主题检索语言更少随意性 。
? 根据引用频率的高低, 并与其它方法配合使用, 可确
定某一论著, 某一杂志, 某一研究者的学术水平, 工
作成绩 。 据研究, 在物理学, 化学, 医学领域中, 诺
贝尔奖获得者被引次数最高者达 18888次, 只有 6人低
于 200次 。
查找过程
? 查找过程如下图:
? 起始参考文献
??引证索引 ?来源索引 ? 原始论著 ? 起始文献的其
它相关论著 ?引文作者的其它相关论著 ?未被引用
选其参考文献之一再行查找 ?从其它文献中查找起始
文献