1
3-3 Subject Retrieval Language
一,主题检索语言的概念与特点二,主题检索语言的基本类型三,,汉语主题词表,与文献标引思考题
2
一、主题检索语言的概念与特点
1,1主题检索语言是指采用描述文献主题的语词标识并按字顺排检的信息检索语言。一般由主题词表及其编制和使用规则组成。
1,2主题检索语言的基本特点
规范化的名词术语直接作为文献主题标识,直观性较好;而体系分类法的类号是规范化的,类目名称却不经过严格规范 。
按字顺序列排检标识,检索者较易使用;而分类检索语言按知识系统排列,用号码表达概念,有一定的间接性 。
按主题集中文献信息,对有关某一事物的检索效率高;而分类检索语言以学科专业为线索集中文献 。
用参照系统及其他方法间接显示文献概念之间的关系,其系统性较差;分类检索语言能够直接显示概念关系 。
接近自然语言,容易与自然语言结合使用 。
3
二、主题检索语言的基本类型
2,1 System of subject heading
2,2 Uniterm indexing
2,3 Descriptor indexing
2,4 Keyword indexing
4
2,1 System of subject heading
标题法的概念:以标题词作为检索标识的文献与检索方法 。 具体而言,标题法是用规范化名词术语作为标识,来直接表达文献所论及或涉及的主题,并将全部标识按字顺排列,通过参照系统来显示各个标识所表达的主题之间的相互关系的一种主题法 。
标题法的基本特点,⑴ 采用规范的检索标识,主,副标题词经规范化处理后按固定的顺序排列在标题词表中 。 ⑵ 采用定组方式,
即以主标题词与副标题词的固定形式组配来表现某一主题概念 。
⑶ 采用二元组配,即一组检索款目多由一个主标题词和一个副标题词组成 。 此外,标题词表中一般只反映同义词的,用 -代,关系,
不反映同族词的,属 -分,关系,族性检索功能较差 。
标题词表:一般由编制说明和主词表等部分构成,主表按主标题词字顺排序,在同一主标题词下再将与之有关的副标题词逐一排列 。 用 see和 see also显示标题词之间的相互关系 。
5
2,2 Uniterm indexing
元词法的概念:以单元词作为检索标识的文献标引和检索方法 。
它是对标题法先组式标识进行改革而形成的一种后组式语言 。 元词是指能够表达文献主题,经过规范化处理的最小,最基本的词汇单元,具有概念上的独立性,单元性和规范性的特点 。
元词法的基本原理:任何一个复合概念都可以分解为若干单元概念,而每个单元概念通常只用一个元词来表达,通过单元词的组配来表达复杂的文献主题概念 。 元词法的基本原理有两个构件,
即单元词表和单元词卡片 。
元词法的主要特点:用较少的词量反映较多的主题概念,具有灵活性和专指性,在各种词表中,单元词表的体积最小 。 但元词法缺乏直接性和系统性,由于常常采用字面组配,易产生组配误差,
检索的查准率较低 。
6
2,3 Descriptor indexing
叙词法的概念与原理叙词的类型和语义关系叙词表及叙词索引
7
叙词法的概念与原理叙词法以自然语言为基础,以规范化的叙词作为检索标识的文献标引与检索方法。叙词法多种信息检索语言的原理和方法的综合。
⑴ 在语词标识上:吸收了标题法对语词进行严格规范化的基本方法,
对语词进行词类、词形、词义、词间关系等多种规范。
⑵ 在语词组配上:适当采用标题法的预先组配,吸收元词法的元词组配原理和后组技术,采用组配分类法的概念组配和词汇分面分类表技术。
⑶ 在语词关系上:采用体系分类法的基本原理编制叙词分类索引和等级索引,采用与键词法类似的方法编制叙词轮排索引,进一步完善了标题法的参照系统,从而从多方面显示叙词间的相互关系。
由此看来,叙词法的基本性质,就是一种采用表示单元概念的规范化语词的组配来对文献主题进行描述的后组式词汇型标识系统。
8
叙词的类型和语义关系
叙词是以概念为基础,经过优选和规范化并具有概念组配和语义关系显示功能,用以表达文献主题和检索需求的词或词组。
叙词可以划分为普通叙词和专用叙词。普通叙词指表示各种事物及其属性的叙词,它表达的通常是普通概念;专用叙词则是表示某一特定事物的叙词,它表达的都是单独或特定概念。
叙词语言具有严密的语义关系。根据词义的需要,叙词相互之间有 3种语义关系:⑴ 等同关系(用-代),指叙词与非叙词之间的关系。⑵ 等级关系(分-属-族),指专指度深浅不同的两个叙词之间的隶属关系。⑶ 相关关系(参-参),指叙词之间存在一定的关联、交错、对立和矛盾的关系(或称类缘关系),两者互为参照。
9
叙词表及叙词索引
叙词表 ( Thesaurus) 是指将自然语言转换成规范化的叙词型主题检索语言的术语控制工具,亦称主题词表 。 它是一种概括某一学科领域,以规范化的,受控的,动态的叙词为基本成份和以参照系统显示词间关系,用于标引,存储和检索文献的词典 。
叙词表一般由一个 主表 和若干个 辅表 组成 。 主表亦称字顺表,是将全部主题词按字顺排列,并添加必要的标注项和显示词间等同,
等级或相关关系的参照项,它是叙词表的主体结构 。 附表则是各种专有叙词索引,如地区索引,机构索引,人名索引,产品索引等,它是从主表中分离出来的专用词汇表 。 附表通常是叙词表的辅助部分 。
10
叙词表 ·主表 ·款目
Bianji Xiaoyong Xuepai 范畴类号边际效用学派 05DB 款目叙词
Marginal utility school
D 边际学派 代参照边际主义
F 奥地利学派 分参照剑桥学派洛桑学派数理学派
S 庸俗资产阶级政治经济学 属对照经济学派 * 族首词符号
Z 政治经济学 族首词 (有两个族首词 )
C 费边社会主义 参参照凯恩斯主义 / 瑞典学派 /新古典学派、新剑桥学派
11
叙词表 ·辅表 ·叙词索引
词族索引 ( 族系表 ),利用概念成族原理将有关叙词汇集在一起成为一族,构成一个从泛指叙词到专指叙词的等级系统 。
范畴索引 ( 分类表 ),将叙词按其概念所属学科或范畴分成若干大类,在大类之下再分成若干小类,在小类之下将叙词按字顺排列,形成一个类似体系分类法的概念分类系统 。
轮排索引:利用字面成族的原理,将含有相同单词的词组叙词汇集在一起,排列在该单词之下,可以从它出发查到任何含有该单词的词组叙词 。
双语种对照索引:提供从另一种语言字顺入手查词的途径,有助于选准不同语言的叙词 。
12
2,4 Keyword indexing
键词法是指以键词作为检索标识的文献标引与检索的方法 。 键词,
是指从文献题名,文摘或文章中直接选取的表示文献主要内容,
具有实际检索意义的单词或词组 。
键词法的主要特点:
⑴ 采用语词作为概念标识,直接从文献中抽取关键词 。 相对于叙词法,标题法和元词法来说,要求标引水平低,尤其适用于计算机处理和自动标引 。
⑵ 具有丰富的轮排方式并建立字顺排列体系,检索非常方便 。 采用键词法的检索系统是时差最短和最经济的检索系统 。
⑶ 由于键词的非规范性,词汇质量较粗略,影响到文献检索的查全率和查准率等 。
键词法的表现形式 —— Keyword Index。
13
三,,汉语主题词表,与文献标引
Chinese Thesaurus:我国第一部大型的综合性主题词表,1974年开始编制,近 9 000人历经 5年时间,于 1980年正式问世 。 词表分 3
卷 10个分册,11万条叙词 。 第 1卷是社会科学,收录主题词 23 500
余条;第 2卷是自然科学,收录主题词 65 200余条,非正式主题词
12 913条;第 3卷是社科与自然科学共用的附表 。
Indexing:标引是 指通过对文献的分析,选用确切的检索标识用以反映该文献的内容的过程 。 标引的实质是对文献的内容特征进行主题类属的划分和用词的转换 。 一般分为分类标引和主题标引
( 包括受控标引和非受控标引 ),而自动标引 ( 抽词标引和赋词标引 ) 则是文献标引的发展趋势 。
文献标引的程序:查重 → 主题分析 → 归类和查表选词 → 确定分类号和主题词 → 审核 。 在标引工作中,要尽量避免标引误差 。 衡量标引的质量指标,包括标引的穷举度,专指度和一致性等 。
14
Chap3 思考题
1、谈谈信息检索语言的概念和特点。
2、信息检索语言有哪些基本类型?
3、信息检索语言有哪些主要功能?
4、什么是分类检索语言?体系分类法有什么基本特征?
5、什么是组配分类法?组配分类法有什么主要特征?
6、主题检索语言有哪些基本特征和类型?
7、如何理解叙词法吸收和发展了多种检索语言的原理和优点?
8、如何认识基本类目、标题词、关键词、元词和叙词?
9、如何看待主题法和分类法的区别与联系?
10、全面熟悉和掌握经济管理分类词表和主题词表的基本内容。