中国科学院研究生院科技情报检索课程第一讲科技情报检索概述主要内容一 信息检索、文献检索与数据检索二 科技文献及其主要类型三 索引与索引法四 文献检索工具科技情报检索概述信息检索 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出相关信息的过程和技术,狭义的信息检索仅指该过程的后半部分。作为检索对象的信息,有的以文献的形式出现,有的以数据或事实的形式出现。
信息检索、文献检索与数据检索根据检索对象形式的不同,信息检索又分为文献检索和数据检索。凡以文献 (包括文摘、题录或全文 )为检索对象的,就叫 文献检索 ;凡以数据或事实为检索对象的,则是 数据检索 。从性质上说,文献检索是一种相关性检索,系统不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考;数据检索则是一种确定性检索,系统可直接回答用户提出的问题,即直接提供用户所需要的确切的数据或事实。
信息检索、文献检索与数据检索主要内容一 信息检索、文献检索与数据检索二 科技文献及其主要类型三 索引与索引法四 文献检索工具科技情报检索概述文献 是用文字、符号或图形等方式记录人类活动或知识的一种信息载体,是人类脑力劳动成果的一种存在形式。 科技文献 是记录科学技术信息或知识的一种载体
,是人们从事科学技术活动的劳动成果的记录和传播形式。
什么是科技文献的主要社会功能知识累积功能 科技文献是记录和传播科技信息的主要手段。
评价功能 科技文献是衡量某一学科领域、
某一个人、某一个集体,以至一个国家的学术水平或成就的重要标志。
教育功能 科技文献是帮助人们认识客观事物、启发思路、开阔眼界、丰富知识的重要工具。
科技文献的载体形式
印刷型文献
缩微型文献
机读型文献
声像型文献印刷型文献以纸张为存贮介质,以手写、
印刷为记录手段而存在的一种传统的文献形式。其优点是便于阅读和传播。其缺点是存贮密度太低,篇幅庞大,体积笨重,占据储藏空间过多,难于实现内容的自动输入和输出,不能做到自动检索。
缩微型文献以感光材料为存贮介质,以缩微照相为记录手段而存在的一种文献形式,主要类型包括缩微胶卷、缩微胶片和缩微卡片。此外还有超级缩微胶片,缩小倍率最高可达数万倍。一张全息胶片可存贮数万页文献。缩微型文献的优点是体积小,存贮密度高,
传递方便,可以大大节省储藏空间。
其主要缺点是不能直接阅读 。
机读型文献全称为计算机可读型文献,是一种以磁性材料 (磁带、磁盘或光盘等 )为存贮介质,
以打字、穿孔或光学字符识别装置为记录手段,并通过计算机处理而生产出来的一种文献形式。机读型文献的优点是存贮密度高,存取速度快,原有记录可以改变、
抹去或更新,可对所记录的信息进行各种处理,如转存、检索、传送、提取、变换、
运算、检测和输出等。其缺点是需要用计算机等设备才能阅读和处理,读者需要掌握相关技术。
声像型文献又称为视听资料或直感资料。是一种以磁性材料和光学材料为存贮介质,借助计算机或特殊的机械装置,直接记录声音信息或图像信息而生产出来的一种文献形式。它包括:唱片、录音带、幻灯片、电影片、电视片、录像带、录像盘,激光唱盘、激光电视录像盘、多媒体学习工具等。
声像型文献的优点是存贮密度高,内容直观真切,声像并茂,表现力强,易于理解,
便于接受,传播效果好。缺点是需要相应的技术设备才能视听。
科技文献的结构等级
一次文献
二次文献一次文献 (primary document)
是指作者以本人的研究成果为基本素材而创作
(撰写)的文献,无论创作时是否参考或引用了他人的著作,也不管该文献以何种载体形式出现,均属于一次文献。一次文献记录的信息比较具体、详尽和系统化。一般习惯上也称一次文献为原始文献或第一手资料。图书、期刊论文、科技报告、会议论文、专利说明书、技术标准以及学位论文等公开发表的文献,都属于一次文献。另外,一次文献还包括不公开发表的文献,如:实验记录、日记、备忘录、内部报告,技术档案、信件等。译文 (包括全译、节译和编译 )一般也属于一次文献。
二次文献 (secondary document)
是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、
出版和累积起来的工具性文献。二次文献也称为第二手资料。一般包括:目录、
题录、文摘、索引、百科全书、年鉴、
手册、统计资料、名录等。
科技文献的类型科技图书 专利文献科技期刊 标准文献科技报告 政府出版物会议文献 学位论文科技图书大多是对已发表的科研成果、生产技术或者某一知识领域所作的系统论述或概括。它往往以期刊论文、会议论文、研究报告,以及其他第一手资料为基本素材,经过作者的分析、归纳、
重新组织编写而完成的。不少科技图书的内容还包含一些从未发表过的研究成果或资料。科技图书的特点是:内容比较系统、全面、成熟、可靠,有一定的新颖性。其缺点是编辑出版时间过长,传递信息的速度较慢,包含的内容一般只反映 3-5年以前的研究水平。
科技图书科技期刊
1、科技期刊的类型
2、科技期刊的特点和职能科技期刊的类型
学术性、技术性刊物 主要刊登科研和生产方面的学术论文、研究报告、实验报告、
临床报告等原始文献。所以,这类期刊的信息量大,信息价值高,是科技期刊的核心部分。
快报性刊物 专门刊载有关最新科研成果的短文,刊载将要发表论文的摘要等。此类期刊的内容简洁,报道速度快。
科技期刊的类型(续)
消息性刊物 一般刊载与学术机构或厂商企业有关的新闻消息,作为机构或企业与社会 (或机构成员之间 )保持联系的纽带。
数据性刊物 主要刊登各种实验数据、统计资料和技术规范等方面的内容,专门向读者报道各种数据或事实。
检索性刊物 以期刊形式出版的专门报道二次文献的一类刊物,即各种类型的连续出版的文献检索工具。
科技期刊的特点和职能特点 数量大、品种多,内容丰富多样,
出版周期短,报道速度快,发行、流通面广泛,连续性强,伴随着相关学科领域的发展而发展。
职能 记录和传播正在进行的科学技术活动,是保存和传播科技信息的主要工具 。
科技报告科技报告是报道(记录)研究工作和调查工作成果或进展情况的一种文献类型,是一种典型的机关团体出版物。科技报告的出版特点是每份报告自成一册,篇幅长短不等,
有连续编号,装订简单,出版发行不规则。
科技报告的内容具有新颖、详尽、专深的特点。包括各种研究方案的选择与比较,成功与失败两方面的经验体会,还常常附有大量的数据、图表、原始实验记录等。
科技报告(续 )
在时间上,科技报告发表比较及时,报道新成果的速度一般快于期刊和其他类型文献。在流通范围上,大部分科技报告属于保密的或限制发行的,仅有一小部分可以公开或半公开发表。因此,人们又称之为 "难得文献 ","灰色文献 "或 "特种文献 "。
专利文献一切与专利制度有关的各种专利文件都可称为专利文献,广义的专利文献包括发明说明书、专利说明书、专利局公报、专利文摘、专利分类与检索工具、申请专利时提交的各种文件 (如请求书、权利要求书、有关证书等 )、与专利有关的法律文件和诉讼资料等。狭义的专利文献一般指专利局出版公布的各种发明说明书或专利说明书,及其所派生出的各种专利的报道与检索工具。它们是专利文献的主体。
会议文献会议文献按出版时间划分,可分为 会前出版物和 会后出版物。
会前出版物 包括会议日程表、会议议程、会议论文预印本和会议论文摘要等。
会后出版物 系指会议结束后,经主办单位 (或其他机构 )整理、编辑出版的正式文献。它的内容比较系统完整,但出版速度较慢。其出版形式比较复杂,有会议录、论文集、图书、期刊特辑、科技报告、期刊论文和声像资料等出版形式。其主要特点是传递信息比较及时,专业针对性较强,
兼有直接交流和文献交流两种交流方式的长处。
标准文献以文件形式出现的标准化工作成果,
就是标准文献。它通常又称为 "技术标准
"或 "标准 "。广义的标准文献包括与标准化工作有关的一切文献,如标准化期刊、
标准化专著 (图书 )和标准化法规、条例、
计划、会议录等。
政府出版物政府出版物是各国政府部门及其所属机构所发表的文件。其内容十分广泛,概括起来可分为行政文件和科技文献两大类。行政文件包括国会记录、司法资料、方针政策、规章制度、决议、
指示,以及调查统计资料等。科技文献主要包括各政府各部门的研究报告、技术政策文件等。科技文献约占政府出版物总量的 30-40%。政府出版物对于了解一个国家的科学技术,经济政策及其演变等情况具有重要的参考价值。
学位论文学位论文是高等院校学生为获得某种学位而撰写的学术论文,一般有学士学位论文、
硕士学位论文和博士学位论文之分。学位论文的水平差别很大,有些论文有一定深度,
或有独到的见解,有些论文成为后来公开发表的文章或专著的基础。一篇质量好的学位论文往往是一种很有价值的信息来源。
世界文献资源的主要发展趋势
文献资源数量急剧增长
文献资源的文种繁多
文献资源的载体形式趋向多样化
文献资源出版更加分散
文献资源的内容交叉重复
文献资源的有效使用寿命缩短
文献资源的电子版和网络版形式日益增多主要内容一 信息检索、文献检索与数据检索二 科技文献及其主要类型三 索引与索引法四 文献检索工具科技情报检索概述索引的定义(一)
将图书、报刊等资料中的各种事物名称(如字、词、人名、书名、刊名、篇名、
主题词、分类号等)分别摘录,或加以注释,指明出处,按字顺或分类编排,附在书刊之后,或单独编辑成册,即称为索引。
索引是查找文献内容的一种工具。英文为
index,也有根据音译,称为“引得”的。
索引的定义(二)
出版物索引:即按所处理的主题、人名、地名、事件,以及其他项目排列的一种详细目录,并指出项目在出版物中的位置。
索引可以采用下列三种方法编排:
a) 款目按字顺排列(主题、人名、地名等) 。
b) 款目按主题或分类次序排列(主题、人名、
学科分类等) 。
c) 款目按年代、号码、字母加号码等分别排列(历史事件、专利、标准、报告、各种号码等) 。
索引的性质从信息检索的意义上看,“索引”是一种指示物,索引的作用是揭示信息在检索系统中所在的物理位置,通常不提供信息或知识内容。因此,索引只是一种指示系统,使读者或用户能够在文献或信息集合中,准确地找出所需的特定文献或信息。
索引的特点索引以具体的主题、观点、事物、概念、
名称、词语、符号等为对象,对文献内容作深入的发掘和全面的揭示,给使用者提供明确的指引。索引具有便于查检,揭示事物比较深入、全面、明确、细致等特点。索引的组织排列方法一般也比较易懂易查,使用者无须经过专门训练就可以使用它。
索引的类型索引可以按不同的标准划分为许多不同的类型:按应用范围可分为通用索引和专用索引;
按用途可分为文献索引、名称索引、词语索引和事物索引;按编制技术可分为手工索引和机编索引;按揭示对象可分为内容索引和非内容索引;
按排列方式可分为字顺索引、分类索引和时序索引;按存贮媒体可分为书本式索引、卡片式索引和机读索引等。
索引款目索引款目( index entry)是描述所指示的某个主题或事物及其在信息集合中的物理地址的一条记录,它是索引的基本单元。索引款目只是一种指示物,不是文献或事物的替代品。它一般只起指示特定信息内容及其存贮地址的作用,不起报道原文内容的作用。
一个索引款目通常包括有三项内容,即标目
(标识)、说明语和存贮地址。
标 目标目( headings)又称索引词,用来表达索引款目所指示的主题或事物,并控制款目在整个索引中的排列位置的语词或符号。标目可根据需要设置为 1-
3个等级,即主标目、副标目和副副标目。标目在款目中位于最明显的位置,是识别某一特定款目的主要标志,故也可称为标识。
每一种标目款目的全体就构成了一种标识系统。
有多少种标目形式,就可以构成多少种标识系统。
标识系统通常又称为索引语言。用不同的标识系统去描述文献的特征并作为索引款目的标目,就形成了不同类型的索引。
说明语索引款目中的说明语( modifications)是指放在标目后面,指示所查信息的特征,解释或限制标目含义的词、词组或短语。说明语在款目中的作用主要有3点:
1.更具体、更准确地解释标目的含义;
2.补充被标目忽略的相关材料;
3.进一步细分同一标目下的相关材料。
说明语的目的在于统一编者和读者对款目含义的理解,决定对款目指示内容的取舍。
标目注释 —— 范围注释范围注释是指从时间、地域、学科、特征等方面对标目的概念范围进行说明或限定。它主要用于区分同形(音)异义词,阐明某些涵义不明确的词在索引中的特定涵义。
最常用的注释方法是使用带括号的限定词,
并把这种限定词看作标目的一部分。例如铜合金(以铜做主要成分的合金)
魏国(公元 220-265年)
环(代数)
环(化学)
环(构件)
标目注释 —— 涵义注释涵义注释是指从用法或涵义上对标目
(或索引词)作出必要而简略的说明或补充,以消除标引和检索过程中可能出现的异议。例如:
白化(遗传病)
低压锅炉(13公斤 /平方厘米左右)
存贮地址存贮地址( reference;location)是指索引款目中所指示的主题或事物在特定信息集合中的物理位置,
如图书正文中的某页,检索工具文摘部分或题录部分中的某条文摘或题录等。
表示存贮地址的形式通常有两种:一种是流水号性质的地址;另一种是报道性质的地址。表示存贮地址的文字或符号一般放在说明语之后。
索引的组织方法全部索引款目和参照款目先按标目排序,标目完全相同的款目再按说明语排序。
由于标目有不同的形式,所以也有不同的排序方法。以普通语词或事物名称做标目的索引,一般按字顺排列。字顺排列法又可分为字母顺序排列法、音序排列法和笔划笔形排列法等。字母顺序排列法里又有逐字排列法和逐词排列法。以某种代码做标目的索引,
则按代码的字顺和数顺排列。由于说明语一般都由词或短语组成,所以也按字顺排列,但位于说明语开头的介词或冠词一般不参加排序。
索引的参照系统索引的参照系统( syndetic system)包括各种参照、标目注释、索引使用说明与凡例等内容。
它们不但可以指引读者进行同义词之间的优选、
相关词的选择,告诉读者某个标目下面放置一些什么内容、标目的组织方法、索引的收录内容范围、命名规则及某些例外情况等,而且还能给标引人员选取参照提供准确全面的指引。
参 照
“参照”( cross-reference)是索引参照系统的主要部分。从本质上讲,参照是反映标目之间语义关系的一种指示物,也是连接相关款目的一种媒介物。它把读者从现在查的地方指引到应该去查的地方,或者指引到同样应该去查的地方,以便查出相关的全部标目和款目。
索引中常见的参照有 2种,即“见”项参照和
“参见”项参照。另外,还有 3种不太常用的参照,
即“见至”参照、说明性参照和反参照。
见( see)项参照
“见”项参照是指示标目与非标目之间的等同替代关系的一种参照,由非标目指向标目。例如:
用于控制同义词之间的分散现象。
如:土豆 见 马铃薯
用来指引读者查反义词(这种用法不普遍)。
如:电阻 见 导电性
用来处理某些太专指的词。
如:计算 见 数学
从一个标目指引到一组同类型的标目。
如:合金 见 各种金属名称下的合金
,参见,( see also)项参照
“参见”参照主要反映以下各种关系:
等级关系,如:
艺术 参见 绘画
整体与部分关系,如:
血液 参见 红血球
产品与应用关系,如:
汽车 参见 运输
因果关系,如:
病毒 参见 疾病索引语言的定义和作用索引语言就是索引款目所使用的标识系统,
是由给定领域中,一切可用来描述信息内容和信息需求的词汇或符号,及其使用规则构成的供标引和检索用的工具。索引语言在检索工作中也称为检索语言,而在标引工作中又称为标引语言。
索引语言的基本功能和普通语言的功能相同,
都是用于交际。不过前者的应用范围很窄、很专,
仅仅在标引者与检索者之间、人与检索机器之间使用,是它们之间交流信息用的一种工具。
索引语言的分类索引语言分 类先组式索引语言 定组式索引语言 体系分类语言 字顺标题语言散组式索引语言:组面分类语言后组式索引语言元词索引语言叙词索引语言语义代码索引语言分类主题一体化语言(如分面叙词表或分类叙词表)
关键词索引语言代码语言(如化学分子式、文献代号等)
引文索引语言先组式字顺主题索引先组式字顺主题索引是采用预先组配好的主题词,做索引款目标目的字顺主题索引。它在检索工具中使用得最为普遍。先组式主题索引所采用的“预先组配”原理主要来自标题法,又成为标题索引语言。
标题词与标题法
“标题词”的含义是“主题标目”,即以某种主题词为索引款目的标目或标识。
由这种标题词组成的索引标识系统,就称为字顺标题语言,简称标题语言。使用标题语言来处理文献和编制主题索引或其它检索系统的一整套方法和程序称为标题法。
元词与元词索引元词( uniterm)又称单元词。它是从文献中抽取出来的、能表达文献主题的最小和最基本的词汇单位。它与普通语言中仅由一个词素构成的词有相似之处。作为元词,它们在字面上一般已不能再分解,否则就会使分解后的词在专业领域内不再具有独立意义。
所有能表达文献主题的元词集合在一起,就构成了元词索引语言。使用元词索引语言来处理文献、
编制检索系统的一整套方法和 程序就称为元词索引法。
叙词索引语言叙词( Descriptor) 语言是专门为文献标引与检索而设计的人工性后组式语言。叙词语言的基本成分是叙词。叙词的概念性比标题词更强,
它的规范化程度也比标题词高,在选取叙词的过程中,对叙词进行了严格的同义规范、词义规范、
词类规范及词形规范。叙词和元词一样,也具有组配性,但叙词的组配是概念组配,而不是字面组配。
叙词法叙词法是建立在叙词语言及其性质的基础上的一种新的标引文献的方法。叙词法的基本原理,概括地说就是通过概念组配来表达主题,以提高标引的专指性和检索的灵活性。这是它与元词法的主要区别。
另外,叙词法还在一定程度上采用了标题法的先组原理,在叙词组配在正确、全面地反映概念的含义有疑问时,就采用词组作为叙词。这样既可以提高叙词的专指性,又可以避免因组配不当产生假联系或歧义现象。
关键词索引关键词是直接从文献的题目、正文或文摘中抽出的具有实际意义的语词。
用关键词做索引款目的标识系统,就称为关键词索引语言 。
著者索引著者索引是一种仅次于主题索引的重要索引,
它的主要途径是:通过著者姓名的指引,使读者查到相关主题的文献或特定的著作。
著者索引可以分为:个人著者索引、团体著者索引、普通著者索引、专利发明人索引、专利权受让人索引和专利权所有人索引等。
专用索引专用索引是为了适应某些专业的特殊需要或某些文献的特点而编制的索引。由于这类索引所用的索引词专业性非常强,索引词的形式也很专一,通常都是某一专业领域的专用名词术语。这些专用名称或符号能表示文献的某一特征,有一定的检索意义,人们常常把它们作为专用索引词来使用。
专用索引的主要用途是:给熟悉有关专业的专门术语、专有名称或代码符号的读者提供一条简洁的检索途径。
索引参照系统常用符号表叙 词 表 标 题 表中文 英文 中文 英文等同 叙 词 Y ( 用) Use 见 See
D (代) UF或 includes 见自 See from
关系 非叙词 SD (组代 ) UFC或 RC
等级 上位叙词 S ( 属) BT或 Specific to 见至 See under
下位叙词 F ( 分) NT或 Generic to 参见 See also
关系 族 首 词 Z ( 族) TT
类缘 相关叙词 C ( 参) RT 参见 See also
关系范围注释 注 SN
主要内容一 信息检索、文献检索与数据检索二 科技文献及其主要类型三 索引与索引法四 文献检索工具科技情报检索概述文献检索工具文献检索工具是指人们用来报道、存储和查找文献的工具。一般来说,检索工具必须具备以下4项重要条件:
对所收录文献的各种特征有详细描述
每条描述记录(款目)都标有检索标识
全部记录科学地组织成一个有机的整体
具有多种必要的检索手段文献检索工具的类型文献检索工具的类型主要包括:
手工检索工具
机械检索工具
计算机检索工具文献检索工具的种类按照载体的种类划分,文献检索工具的种类可分为:
书本式
卡片式
缩微式
磁媒体式
光盘式
联机式
网络式文摘检索工具
报道性文摘( Informative abstract)
指示性文摘( Indicative abstract)
文摘性检索工具的结构报道性文摘报道性文摘是原文内容的浓缩,基本上能反映原文的技术内容,信息量大,参考价值高。读者通过阅读这种文摘,有时可以代替阅读原文。报道性文摘对帮助读者了解某些难得文献和克服语言障碍,作用十分突出。报道性文摘长度一般在 200-
300字左右,更长的可达 500字以上。
指示性文摘这是旨在把原文的主题范围、目的和方法概略地指示给读者的一种文摘。
文摘通常不包含具体的数据、方法、设备、结论等内容。它的长度一般不超过
100字,有的甚至只有一句话,只起到解题的作用,故又称为 "解题性文摘 "或
"简介 "。
文摘性检索工具的结构
编辑说明与凡例
文献分类表和主题词表
文摘部分(正文)
辅助索引
资料来源目录和附录目录性检索工具目录是按照某种明白易懂的顺序编辑排列的文献清单,通常以一个完整的出版单位或收藏单位为著录的基本单位。目录对文献的描述比较简单,只记述其外部特征。一种出版物经过这样的描述后,就获得了一个目录款目,将一个个款目按照某种方法组织起来,就构成了目录。目录可分为 出版发行目录、馆藏目录 和 资料来源目录 等 。
出版发行目录包括登记性的国家书目和商业性的出版商、书商目录。国家书目是出版物国家登记制度的产物,是有关一个国家全部出版物的现状和历史的记录。现在我国的国家书目有两种:月刊性的《全国新书目》和年刊性的《全国总书目》。出版商、书商目录是预告图书出版信息,进行图书贸易的工具,也是图书情报部门了解图书市场动态、搜集图书资料的重要依据。
馆藏目录包括反映单个图书馆图书收藏情况的馆藏图书目录和反映某一地区或系统,甚至全国的图书收藏情况的图书联合目录。馆藏目录是图书馆文献收藏情况的真实记录,是读者到图书馆查找和借阅图书的重要工具。在进行文献检索的过程中,最后往往需要查找原文。馆藏目录就是查找原文和获得原文的必要工具。在这方面,如有条件应注意加强对联合目录的利用。
资料来源目录是指附属于某种检索工具或检索系统的“引用出版物目录”,有的亦称
“资料来源索引”。资料来源目录是供读者了解某一检索工具的文献收录情况和期刊演变情况,准确鉴别文摘或题录出处的辅助性工具。
题录性检索工具题录是用来描述某一文献的外部特征,并由一组著录项目构成的一条文献记录。题录通常以一个内容上相对独立的文献单元为基本著录单位。(例如期刊上的一篇文章或图书中的一个章节,但有时也可以是整本出版物)这是它与目录款目的主要区别。两者的相同点是它们都只限于描述文献的外部特征。题录实质上是一种不含文摘正文的文摘款目。
在揭示文献内容的深度方面,题录比目录做得深入,
但又浅于文摘款目。
最新期刊目次页汇编又称现期目次( current contents),直接取材于刚出版的重要期刊,对期刊的目次页加以简单编辑制作,然后照相排印而成的一类题录性检索期刊。这种检索工具的主要优点是加工简便易行,报道速度快。其缺点是对文献特征的描述不够全面,著录格式不规范,对目次页中反映的文章不加分析地全面收录,报道文献分散,读者难以得到较完整的专题资料。因此,它只能作为一种临时性、过渡性的检索工具,不能供回溯性检索使用。
期刊论文题录它是由计算机将期刊文章按篇名关键词轮排而形成的一种题录性检索工具,又称为轮排索引型题录刊物。其典型代表是美国化学文摘社编印的《化学题录》。该刊为双周刊,摘录化学领域的重要期刊 700余种。这种题录刊物的优缺点和用途跟期刊目次页汇编型检索工具基本相同,作为过渡性的检索工具,其检索性能比目次页汇编要好一些。
检索工具的质量评价衡量一种检索工具的质量,一般应从以下 5个方面去考虑:
1,收录范围是否明确、全面;
2,报道量大不大;
3,摘录质量高不高;
4,报道速度快不快;
5,检索功能是否完善。
文献检索途径内容特征途径 外部特征途径分类途径 主题途径题名途径著者途径文献编号途径其它途径文献检索途径文献检索程序
分析研究课题,明确文献需求
选择检索工具,确定检索方法
确定检索途径和检索标识
查找文献线索,获取文献原文
Thanks for listening!
信息检索、文献检索与数据检索根据检索对象形式的不同,信息检索又分为文献检索和数据检索。凡以文献 (包括文摘、题录或全文 )为检索对象的,就叫 文献检索 ;凡以数据或事实为检索对象的,则是 数据检索 。从性质上说,文献检索是一种相关性检索,系统不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考;数据检索则是一种确定性检索,系统可直接回答用户提出的问题,即直接提供用户所需要的确切的数据或事实。
信息检索、文献检索与数据检索主要内容一 信息检索、文献检索与数据检索二 科技文献及其主要类型三 索引与索引法四 文献检索工具科技情报检索概述文献 是用文字、符号或图形等方式记录人类活动或知识的一种信息载体,是人类脑力劳动成果的一种存在形式。 科技文献 是记录科学技术信息或知识的一种载体
,是人们从事科学技术活动的劳动成果的记录和传播形式。
什么是科技文献的主要社会功能知识累积功能 科技文献是记录和传播科技信息的主要手段。
评价功能 科技文献是衡量某一学科领域、
某一个人、某一个集体,以至一个国家的学术水平或成就的重要标志。
教育功能 科技文献是帮助人们认识客观事物、启发思路、开阔眼界、丰富知识的重要工具。
科技文献的载体形式
印刷型文献
缩微型文献
机读型文献
声像型文献印刷型文献以纸张为存贮介质,以手写、
印刷为记录手段而存在的一种传统的文献形式。其优点是便于阅读和传播。其缺点是存贮密度太低,篇幅庞大,体积笨重,占据储藏空间过多,难于实现内容的自动输入和输出,不能做到自动检索。
缩微型文献以感光材料为存贮介质,以缩微照相为记录手段而存在的一种文献形式,主要类型包括缩微胶卷、缩微胶片和缩微卡片。此外还有超级缩微胶片,缩小倍率最高可达数万倍。一张全息胶片可存贮数万页文献。缩微型文献的优点是体积小,存贮密度高,
传递方便,可以大大节省储藏空间。
其主要缺点是不能直接阅读 。
机读型文献全称为计算机可读型文献,是一种以磁性材料 (磁带、磁盘或光盘等 )为存贮介质,
以打字、穿孔或光学字符识别装置为记录手段,并通过计算机处理而生产出来的一种文献形式。机读型文献的优点是存贮密度高,存取速度快,原有记录可以改变、
抹去或更新,可对所记录的信息进行各种处理,如转存、检索、传送、提取、变换、
运算、检测和输出等。其缺点是需要用计算机等设备才能阅读和处理,读者需要掌握相关技术。
声像型文献又称为视听资料或直感资料。是一种以磁性材料和光学材料为存贮介质,借助计算机或特殊的机械装置,直接记录声音信息或图像信息而生产出来的一种文献形式。它包括:唱片、录音带、幻灯片、电影片、电视片、录像带、录像盘,激光唱盘、激光电视录像盘、多媒体学习工具等。
声像型文献的优点是存贮密度高,内容直观真切,声像并茂,表现力强,易于理解,
便于接受,传播效果好。缺点是需要相应的技术设备才能视听。
科技文献的结构等级
一次文献
二次文献一次文献 (primary document)
是指作者以本人的研究成果为基本素材而创作
(撰写)的文献,无论创作时是否参考或引用了他人的著作,也不管该文献以何种载体形式出现,均属于一次文献。一次文献记录的信息比较具体、详尽和系统化。一般习惯上也称一次文献为原始文献或第一手资料。图书、期刊论文、科技报告、会议论文、专利说明书、技术标准以及学位论文等公开发表的文献,都属于一次文献。另外,一次文献还包括不公开发表的文献,如:实验记录、日记、备忘录、内部报告,技术档案、信件等。译文 (包括全译、节译和编译 )一般也属于一次文献。
二次文献 (secondary document)
是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、
出版和累积起来的工具性文献。二次文献也称为第二手资料。一般包括:目录、
题录、文摘、索引、百科全书、年鉴、
手册、统计资料、名录等。
科技文献的类型科技图书 专利文献科技期刊 标准文献科技报告 政府出版物会议文献 学位论文科技图书大多是对已发表的科研成果、生产技术或者某一知识领域所作的系统论述或概括。它往往以期刊论文、会议论文、研究报告,以及其他第一手资料为基本素材,经过作者的分析、归纳、
重新组织编写而完成的。不少科技图书的内容还包含一些从未发表过的研究成果或资料。科技图书的特点是:内容比较系统、全面、成熟、可靠,有一定的新颖性。其缺点是编辑出版时间过长,传递信息的速度较慢,包含的内容一般只反映 3-5年以前的研究水平。
科技图书科技期刊
1、科技期刊的类型
2、科技期刊的特点和职能科技期刊的类型
学术性、技术性刊物 主要刊登科研和生产方面的学术论文、研究报告、实验报告、
临床报告等原始文献。所以,这类期刊的信息量大,信息价值高,是科技期刊的核心部分。
快报性刊物 专门刊载有关最新科研成果的短文,刊载将要发表论文的摘要等。此类期刊的内容简洁,报道速度快。
科技期刊的类型(续)
消息性刊物 一般刊载与学术机构或厂商企业有关的新闻消息,作为机构或企业与社会 (或机构成员之间 )保持联系的纽带。
数据性刊物 主要刊登各种实验数据、统计资料和技术规范等方面的内容,专门向读者报道各种数据或事实。
检索性刊物 以期刊形式出版的专门报道二次文献的一类刊物,即各种类型的连续出版的文献检索工具。
科技期刊的特点和职能特点 数量大、品种多,内容丰富多样,
出版周期短,报道速度快,发行、流通面广泛,连续性强,伴随着相关学科领域的发展而发展。
职能 记录和传播正在进行的科学技术活动,是保存和传播科技信息的主要工具 。
科技报告科技报告是报道(记录)研究工作和调查工作成果或进展情况的一种文献类型,是一种典型的机关团体出版物。科技报告的出版特点是每份报告自成一册,篇幅长短不等,
有连续编号,装订简单,出版发行不规则。
科技报告的内容具有新颖、详尽、专深的特点。包括各种研究方案的选择与比较,成功与失败两方面的经验体会,还常常附有大量的数据、图表、原始实验记录等。
科技报告(续 )
在时间上,科技报告发表比较及时,报道新成果的速度一般快于期刊和其他类型文献。在流通范围上,大部分科技报告属于保密的或限制发行的,仅有一小部分可以公开或半公开发表。因此,人们又称之为 "难得文献 ","灰色文献 "或 "特种文献 "。
专利文献一切与专利制度有关的各种专利文件都可称为专利文献,广义的专利文献包括发明说明书、专利说明书、专利局公报、专利文摘、专利分类与检索工具、申请专利时提交的各种文件 (如请求书、权利要求书、有关证书等 )、与专利有关的法律文件和诉讼资料等。狭义的专利文献一般指专利局出版公布的各种发明说明书或专利说明书,及其所派生出的各种专利的报道与检索工具。它们是专利文献的主体。
会议文献会议文献按出版时间划分,可分为 会前出版物和 会后出版物。
会前出版物 包括会议日程表、会议议程、会议论文预印本和会议论文摘要等。
会后出版物 系指会议结束后,经主办单位 (或其他机构 )整理、编辑出版的正式文献。它的内容比较系统完整,但出版速度较慢。其出版形式比较复杂,有会议录、论文集、图书、期刊特辑、科技报告、期刊论文和声像资料等出版形式。其主要特点是传递信息比较及时,专业针对性较强,
兼有直接交流和文献交流两种交流方式的长处。
标准文献以文件形式出现的标准化工作成果,
就是标准文献。它通常又称为 "技术标准
"或 "标准 "。广义的标准文献包括与标准化工作有关的一切文献,如标准化期刊、
标准化专著 (图书 )和标准化法规、条例、
计划、会议录等。
政府出版物政府出版物是各国政府部门及其所属机构所发表的文件。其内容十分广泛,概括起来可分为行政文件和科技文献两大类。行政文件包括国会记录、司法资料、方针政策、规章制度、决议、
指示,以及调查统计资料等。科技文献主要包括各政府各部门的研究报告、技术政策文件等。科技文献约占政府出版物总量的 30-40%。政府出版物对于了解一个国家的科学技术,经济政策及其演变等情况具有重要的参考价值。
学位论文学位论文是高等院校学生为获得某种学位而撰写的学术论文,一般有学士学位论文、
硕士学位论文和博士学位论文之分。学位论文的水平差别很大,有些论文有一定深度,
或有独到的见解,有些论文成为后来公开发表的文章或专著的基础。一篇质量好的学位论文往往是一种很有价值的信息来源。
世界文献资源的主要发展趋势
文献资源数量急剧增长
文献资源的文种繁多
文献资源的载体形式趋向多样化
文献资源出版更加分散
文献资源的内容交叉重复
文献资源的有效使用寿命缩短
文献资源的电子版和网络版形式日益增多主要内容一 信息检索、文献检索与数据检索二 科技文献及其主要类型三 索引与索引法四 文献检索工具科技情报检索概述索引的定义(一)
将图书、报刊等资料中的各种事物名称(如字、词、人名、书名、刊名、篇名、
主题词、分类号等)分别摘录,或加以注释,指明出处,按字顺或分类编排,附在书刊之后,或单独编辑成册,即称为索引。
索引是查找文献内容的一种工具。英文为
index,也有根据音译,称为“引得”的。
索引的定义(二)
出版物索引:即按所处理的主题、人名、地名、事件,以及其他项目排列的一种详细目录,并指出项目在出版物中的位置。
索引可以采用下列三种方法编排:
a) 款目按字顺排列(主题、人名、地名等) 。
b) 款目按主题或分类次序排列(主题、人名、
学科分类等) 。
c) 款目按年代、号码、字母加号码等分别排列(历史事件、专利、标准、报告、各种号码等) 。
索引的性质从信息检索的意义上看,“索引”是一种指示物,索引的作用是揭示信息在检索系统中所在的物理位置,通常不提供信息或知识内容。因此,索引只是一种指示系统,使读者或用户能够在文献或信息集合中,准确地找出所需的特定文献或信息。
索引的特点索引以具体的主题、观点、事物、概念、
名称、词语、符号等为对象,对文献内容作深入的发掘和全面的揭示,给使用者提供明确的指引。索引具有便于查检,揭示事物比较深入、全面、明确、细致等特点。索引的组织排列方法一般也比较易懂易查,使用者无须经过专门训练就可以使用它。
索引的类型索引可以按不同的标准划分为许多不同的类型:按应用范围可分为通用索引和专用索引;
按用途可分为文献索引、名称索引、词语索引和事物索引;按编制技术可分为手工索引和机编索引;按揭示对象可分为内容索引和非内容索引;
按排列方式可分为字顺索引、分类索引和时序索引;按存贮媒体可分为书本式索引、卡片式索引和机读索引等。
索引款目索引款目( index entry)是描述所指示的某个主题或事物及其在信息集合中的物理地址的一条记录,它是索引的基本单元。索引款目只是一种指示物,不是文献或事物的替代品。它一般只起指示特定信息内容及其存贮地址的作用,不起报道原文内容的作用。
一个索引款目通常包括有三项内容,即标目
(标识)、说明语和存贮地址。
标 目标目( headings)又称索引词,用来表达索引款目所指示的主题或事物,并控制款目在整个索引中的排列位置的语词或符号。标目可根据需要设置为 1-
3个等级,即主标目、副标目和副副标目。标目在款目中位于最明显的位置,是识别某一特定款目的主要标志,故也可称为标识。
每一种标目款目的全体就构成了一种标识系统。
有多少种标目形式,就可以构成多少种标识系统。
标识系统通常又称为索引语言。用不同的标识系统去描述文献的特征并作为索引款目的标目,就形成了不同类型的索引。
说明语索引款目中的说明语( modifications)是指放在标目后面,指示所查信息的特征,解释或限制标目含义的词、词组或短语。说明语在款目中的作用主要有3点:
1.更具体、更准确地解释标目的含义;
2.补充被标目忽略的相关材料;
3.进一步细分同一标目下的相关材料。
说明语的目的在于统一编者和读者对款目含义的理解,决定对款目指示内容的取舍。
标目注释 —— 范围注释范围注释是指从时间、地域、学科、特征等方面对标目的概念范围进行说明或限定。它主要用于区分同形(音)异义词,阐明某些涵义不明确的词在索引中的特定涵义。
最常用的注释方法是使用带括号的限定词,
并把这种限定词看作标目的一部分。例如铜合金(以铜做主要成分的合金)
魏国(公元 220-265年)
环(代数)
环(化学)
环(构件)
标目注释 —— 涵义注释涵义注释是指从用法或涵义上对标目
(或索引词)作出必要而简略的说明或补充,以消除标引和检索过程中可能出现的异议。例如:
白化(遗传病)
低压锅炉(13公斤 /平方厘米左右)
存贮地址存贮地址( reference;location)是指索引款目中所指示的主题或事物在特定信息集合中的物理位置,
如图书正文中的某页,检索工具文摘部分或题录部分中的某条文摘或题录等。
表示存贮地址的形式通常有两种:一种是流水号性质的地址;另一种是报道性质的地址。表示存贮地址的文字或符号一般放在说明语之后。
索引的组织方法全部索引款目和参照款目先按标目排序,标目完全相同的款目再按说明语排序。
由于标目有不同的形式,所以也有不同的排序方法。以普通语词或事物名称做标目的索引,一般按字顺排列。字顺排列法又可分为字母顺序排列法、音序排列法和笔划笔形排列法等。字母顺序排列法里又有逐字排列法和逐词排列法。以某种代码做标目的索引,
则按代码的字顺和数顺排列。由于说明语一般都由词或短语组成,所以也按字顺排列,但位于说明语开头的介词或冠词一般不参加排序。
索引的参照系统索引的参照系统( syndetic system)包括各种参照、标目注释、索引使用说明与凡例等内容。
它们不但可以指引读者进行同义词之间的优选、
相关词的选择,告诉读者某个标目下面放置一些什么内容、标目的组织方法、索引的收录内容范围、命名规则及某些例外情况等,而且还能给标引人员选取参照提供准确全面的指引。
参 照
“参照”( cross-reference)是索引参照系统的主要部分。从本质上讲,参照是反映标目之间语义关系的一种指示物,也是连接相关款目的一种媒介物。它把读者从现在查的地方指引到应该去查的地方,或者指引到同样应该去查的地方,以便查出相关的全部标目和款目。
索引中常见的参照有 2种,即“见”项参照和
“参见”项参照。另外,还有 3种不太常用的参照,
即“见至”参照、说明性参照和反参照。
见( see)项参照
“见”项参照是指示标目与非标目之间的等同替代关系的一种参照,由非标目指向标目。例如:
用于控制同义词之间的分散现象。
如:土豆 见 马铃薯
用来指引读者查反义词(这种用法不普遍)。
如:电阻 见 导电性
用来处理某些太专指的词。
如:计算 见 数学
从一个标目指引到一组同类型的标目。
如:合金 见 各种金属名称下的合金
,参见,( see also)项参照
“参见”参照主要反映以下各种关系:
等级关系,如:
艺术 参见 绘画
整体与部分关系,如:
血液 参见 红血球
产品与应用关系,如:
汽车 参见 运输
因果关系,如:
病毒 参见 疾病索引语言的定义和作用索引语言就是索引款目所使用的标识系统,
是由给定领域中,一切可用来描述信息内容和信息需求的词汇或符号,及其使用规则构成的供标引和检索用的工具。索引语言在检索工作中也称为检索语言,而在标引工作中又称为标引语言。
索引语言的基本功能和普通语言的功能相同,
都是用于交际。不过前者的应用范围很窄、很专,
仅仅在标引者与检索者之间、人与检索机器之间使用,是它们之间交流信息用的一种工具。
索引语言的分类索引语言分 类先组式索引语言 定组式索引语言 体系分类语言 字顺标题语言散组式索引语言:组面分类语言后组式索引语言元词索引语言叙词索引语言语义代码索引语言分类主题一体化语言(如分面叙词表或分类叙词表)
关键词索引语言代码语言(如化学分子式、文献代号等)
引文索引语言先组式字顺主题索引先组式字顺主题索引是采用预先组配好的主题词,做索引款目标目的字顺主题索引。它在检索工具中使用得最为普遍。先组式主题索引所采用的“预先组配”原理主要来自标题法,又成为标题索引语言。
标题词与标题法
“标题词”的含义是“主题标目”,即以某种主题词为索引款目的标目或标识。
由这种标题词组成的索引标识系统,就称为字顺标题语言,简称标题语言。使用标题语言来处理文献和编制主题索引或其它检索系统的一整套方法和程序称为标题法。
元词与元词索引元词( uniterm)又称单元词。它是从文献中抽取出来的、能表达文献主题的最小和最基本的词汇单位。它与普通语言中仅由一个词素构成的词有相似之处。作为元词,它们在字面上一般已不能再分解,否则就会使分解后的词在专业领域内不再具有独立意义。
所有能表达文献主题的元词集合在一起,就构成了元词索引语言。使用元词索引语言来处理文献、
编制检索系统的一整套方法和 程序就称为元词索引法。
叙词索引语言叙词( Descriptor) 语言是专门为文献标引与检索而设计的人工性后组式语言。叙词语言的基本成分是叙词。叙词的概念性比标题词更强,
它的规范化程度也比标题词高,在选取叙词的过程中,对叙词进行了严格的同义规范、词义规范、
词类规范及词形规范。叙词和元词一样,也具有组配性,但叙词的组配是概念组配,而不是字面组配。
叙词法叙词法是建立在叙词语言及其性质的基础上的一种新的标引文献的方法。叙词法的基本原理,概括地说就是通过概念组配来表达主题,以提高标引的专指性和检索的灵活性。这是它与元词法的主要区别。
另外,叙词法还在一定程度上采用了标题法的先组原理,在叙词组配在正确、全面地反映概念的含义有疑问时,就采用词组作为叙词。这样既可以提高叙词的专指性,又可以避免因组配不当产生假联系或歧义现象。
关键词索引关键词是直接从文献的题目、正文或文摘中抽出的具有实际意义的语词。
用关键词做索引款目的标识系统,就称为关键词索引语言 。
著者索引著者索引是一种仅次于主题索引的重要索引,
它的主要途径是:通过著者姓名的指引,使读者查到相关主题的文献或特定的著作。
著者索引可以分为:个人著者索引、团体著者索引、普通著者索引、专利发明人索引、专利权受让人索引和专利权所有人索引等。
专用索引专用索引是为了适应某些专业的特殊需要或某些文献的特点而编制的索引。由于这类索引所用的索引词专业性非常强,索引词的形式也很专一,通常都是某一专业领域的专用名词术语。这些专用名称或符号能表示文献的某一特征,有一定的检索意义,人们常常把它们作为专用索引词来使用。
专用索引的主要用途是:给熟悉有关专业的专门术语、专有名称或代码符号的读者提供一条简洁的检索途径。
索引参照系统常用符号表叙 词 表 标 题 表中文 英文 中文 英文等同 叙 词 Y ( 用) Use 见 See
D (代) UF或 includes 见自 See from
关系 非叙词 SD (组代 ) UFC或 RC
等级 上位叙词 S ( 属) BT或 Specific to 见至 See under
下位叙词 F ( 分) NT或 Generic to 参见 See also
关系 族 首 词 Z ( 族) TT
类缘 相关叙词 C ( 参) RT 参见 See also
关系范围注释 注 SN
主要内容一 信息检索、文献检索与数据检索二 科技文献及其主要类型三 索引与索引法四 文献检索工具科技情报检索概述文献检索工具文献检索工具是指人们用来报道、存储和查找文献的工具。一般来说,检索工具必须具备以下4项重要条件:
对所收录文献的各种特征有详细描述
每条描述记录(款目)都标有检索标识
全部记录科学地组织成一个有机的整体
具有多种必要的检索手段文献检索工具的类型文献检索工具的类型主要包括:
手工检索工具
机械检索工具
计算机检索工具文献检索工具的种类按照载体的种类划分,文献检索工具的种类可分为:
书本式
卡片式
缩微式
磁媒体式
光盘式
联机式
网络式文摘检索工具
报道性文摘( Informative abstract)
指示性文摘( Indicative abstract)
文摘性检索工具的结构报道性文摘报道性文摘是原文内容的浓缩,基本上能反映原文的技术内容,信息量大,参考价值高。读者通过阅读这种文摘,有时可以代替阅读原文。报道性文摘对帮助读者了解某些难得文献和克服语言障碍,作用十分突出。报道性文摘长度一般在 200-
300字左右,更长的可达 500字以上。
指示性文摘这是旨在把原文的主题范围、目的和方法概略地指示给读者的一种文摘。
文摘通常不包含具体的数据、方法、设备、结论等内容。它的长度一般不超过
100字,有的甚至只有一句话,只起到解题的作用,故又称为 "解题性文摘 "或
"简介 "。
文摘性检索工具的结构
编辑说明与凡例
文献分类表和主题词表
文摘部分(正文)
辅助索引
资料来源目录和附录目录性检索工具目录是按照某种明白易懂的顺序编辑排列的文献清单,通常以一个完整的出版单位或收藏单位为著录的基本单位。目录对文献的描述比较简单,只记述其外部特征。一种出版物经过这样的描述后,就获得了一个目录款目,将一个个款目按照某种方法组织起来,就构成了目录。目录可分为 出版发行目录、馆藏目录 和 资料来源目录 等 。
出版发行目录包括登记性的国家书目和商业性的出版商、书商目录。国家书目是出版物国家登记制度的产物,是有关一个国家全部出版物的现状和历史的记录。现在我国的国家书目有两种:月刊性的《全国新书目》和年刊性的《全国总书目》。出版商、书商目录是预告图书出版信息,进行图书贸易的工具,也是图书情报部门了解图书市场动态、搜集图书资料的重要依据。
馆藏目录包括反映单个图书馆图书收藏情况的馆藏图书目录和反映某一地区或系统,甚至全国的图书收藏情况的图书联合目录。馆藏目录是图书馆文献收藏情况的真实记录,是读者到图书馆查找和借阅图书的重要工具。在进行文献检索的过程中,最后往往需要查找原文。馆藏目录就是查找原文和获得原文的必要工具。在这方面,如有条件应注意加强对联合目录的利用。
资料来源目录是指附属于某种检索工具或检索系统的“引用出版物目录”,有的亦称
“资料来源索引”。资料来源目录是供读者了解某一检索工具的文献收录情况和期刊演变情况,准确鉴别文摘或题录出处的辅助性工具。
题录性检索工具题录是用来描述某一文献的外部特征,并由一组著录项目构成的一条文献记录。题录通常以一个内容上相对独立的文献单元为基本著录单位。(例如期刊上的一篇文章或图书中的一个章节,但有时也可以是整本出版物)这是它与目录款目的主要区别。两者的相同点是它们都只限于描述文献的外部特征。题录实质上是一种不含文摘正文的文摘款目。
在揭示文献内容的深度方面,题录比目录做得深入,
但又浅于文摘款目。
最新期刊目次页汇编又称现期目次( current contents),直接取材于刚出版的重要期刊,对期刊的目次页加以简单编辑制作,然后照相排印而成的一类题录性检索期刊。这种检索工具的主要优点是加工简便易行,报道速度快。其缺点是对文献特征的描述不够全面,著录格式不规范,对目次页中反映的文章不加分析地全面收录,报道文献分散,读者难以得到较完整的专题资料。因此,它只能作为一种临时性、过渡性的检索工具,不能供回溯性检索使用。
期刊论文题录它是由计算机将期刊文章按篇名关键词轮排而形成的一种题录性检索工具,又称为轮排索引型题录刊物。其典型代表是美国化学文摘社编印的《化学题录》。该刊为双周刊,摘录化学领域的重要期刊 700余种。这种题录刊物的优缺点和用途跟期刊目次页汇编型检索工具基本相同,作为过渡性的检索工具,其检索性能比目次页汇编要好一些。
检索工具的质量评价衡量一种检索工具的质量,一般应从以下 5个方面去考虑:
1,收录范围是否明确、全面;
2,报道量大不大;
3,摘录质量高不高;
4,报道速度快不快;
5,检索功能是否完善。
文献检索途径内容特征途径 外部特征途径分类途径 主题途径题名途径著者途径文献编号途径其它途径文献检索途径文献检索程序
分析研究课题,明确文献需求
选择检索工具,确定检索方法
确定检索途径和检索标识
查找文献线索,获取文献原文
Thanks for listening!