1
Chap3 Retrieval Language
3-1 检索语言概述
3-2 分类检索语言
3-3 主题检索语言思考题课题 4:经济管理网络信息分类的基本特征
2
3-1 检索语言概述一、检索语言的概念和特点二、检索语言的类型与谱系三、检索语言的构成和基本功能四、检索语言的基本原理五,检索语言的基本要求
3
一、信息检索语言的概念和特点信息检索语言是根据信息检索的需要而创制的人工语言,其实质是表达一系列概括文献信息内容的概念及其相互关系的概念标识系统 。
它可以是从自然语言中精选出来并加以规范化的一套词汇,也可以是代表某种分类体系的一套分类号码,还可以是代表某一类事物的某一方面特征的一套代码,用以对文献内容和信息需要进行主题标引,逻辑分类或特征描述 。
⑴ 简明扼要地表达文献及其检索课题的主题概念,使词语和概念一一对应,排除一词多义,多词一义或词义含糊等现象 。
⑵ 科学准确地匹配概念,即将检索时的标引用语和检索用语进行相符性比较 。
⑶ 全面有效地显示概念之间的相互关系 。 采用等级结构,参照系统,
轮排聚类法,范畴聚类法和图示法等各种显示概念之间关系的方法,来实现对内容相同或相关的信息加以集中或揭示其相关性 。
4
二、检索语言的类型与谱系
2,1 依据检索语言的构成原理,把检索语言划分为分类检索语言、
主题检索语言、分类-主题一体化语言、代码语言和引文语言等类型。
2,2 依据检索语言的受控情况,把检索语言分为 Artificial Language
和 Natural Language。
此外,可以按检索语言的学科或专业范围、适用范围、检索标识的组合使用方法以及对信息特征的描述等标准,对检索语言进行划分。
2,3 检索语言的谱系
5
2,1 按构成原理对检索语言进行划分分类检索语言是指使用分类号码表达文献主题标识,并按照知识分类的原理加以排列的一类信息检索语言。
主题检索语言则是指使用名词术语表达文献主题标识,并照按字顺加以排列的一类信息检索语言。
分类检索语言和主题检索语言相互影响、渗透、补充和结合,从而出现了分类主题一体化语言,即分类语言和叙词语言在术语系统、参照系统、标识系统和索引系统等方面完全实现兼容所组成的统一体。如分面叙词表、叙词表式字顺索引、分类表 -叙词表对照索引及集成词表等等。
代码检索语言是指用来标引、检索特定专业文献的某种代码系统。
引文检索语言则是基于文献之间的引证关系而形成的一种检索语言。它以引文为检索词,根据引证关系将有关文献自然地耦合在一起。
6
2,2 按语言受控情况对检索语言进行划分
Artificial Language是指采用 Controlled term并进行人工控制的语言,或称受控语言。所谓规范词是指采用特定的词汇来专指或网罗相应的概念,它们能够对同义词、近义词、相关词、多义词及缩略语等进行规范。使用规范词能够提高检索效率。单元词语言、标题词语言、叙词语言等都是规范语言。
Natural Language 是指采用 Uncontrolled term,即不加规范、不受控制的 Free term,它们直接来自所处理的文献本身的标引用语或检索用语,在使用前未经优选和规范化处理。
7
2,3 检索语言的谱系一般地,可以将检索语言类型按亲属关系划分为 4个层次,从而构成检索语言的谱系。
检索语言语系 检索语言语族 检索语言语支 检索语言语种描述文献内容 分类检索语言 标题词法特征的检索语言 主题检索语言 元词法分类主题一体 叙词法 汉语主题词表描述文献外在 化语言 键词法特征的检索语言
8
三、检索语言的构成和基本功能
1,检索语言的构成 。 检索语言包括两个部分:一是检索语言词汇,
即登录在分类表,词表中的全部标识 。 一个标识 (分类号,检索词,代码 )就是它的一个语词,而分类表,词表,代码表则是它的词典 。 二是检索语言语法,它是指如何创造和运用那些标识来正确表达文献内容和信息需要,以有效地实现信息检索的一整套规则 。 检索语言语法可以进一步分为词法和句法两个方面 。
2,检索语言的基本功能 。
对文献的信息知识内容及某些外部特征加以标引;
对内容相同或相关的信息加以集中或揭示其相关性;
对大量信息加以系统化或组织化;
便于对标引用语和检索用语进行相符性比较 。
9
四、检索语言的基本原理
1,基本原理与机制之一:概念逻辑概念逻辑是揭示事物本质属性及各种事物之间联系与区别的科学思维方式,它反映概念之间的关系,确定概念的类型,内涵和外延等 。 检索语言就是运用概念之间的各种关系,对文献内容和外部特征进行标引 。 具体而言,概念的划分与概括,侧重于概念的隶属关系和并列关系,并据此建立检索语言的概念等级体系 。 概念的分析与综合,主要是利用概念的交叉关系,依此建立检索语言的概念组配体系 。
2,基本原理与机制之二:知识分类知识分类是指以各门科学所研究的运动形态的固有特征及其互相关联与转变的次序为依据,对整个科学知识领域所做的分类 。 目的是考察各门科学之间的区别与联系,确定各门科学的内部结构,
建立相应的分类体系,以反映当代科技水平并指导科学的 发展 。
10
五、信息检索语言的基本要求
1,保证较高的检全率和检准率 。
2,能满足多种检索要求 。 从学科,专业出发的族性检索,
从事物出发的特性检索,多途径,多因素检索以及检索范围的自由改变 。
3,易于标引,易于检索,减少标引和检索误差 。 这就需要语词或符号的明确性,语法的严谨性,标识的直观性,排序的易理解性,查词查号手段的多样性以及整个语言包含概念的丰富和完备性等 。
4,多方面的适应性 。
5,具有与其它检索语言的兼容性和通用性 。
6,具有不断进行现代化改造的可能性 。