《信息检索与利用》知识点
(2009-3)
一、讲授内容及学时数
1.内容绪论第一章 信息与信息资源第二章 信息检索基础知识第三章 中文主要信息资源检索系统第四章 外文信息检索系统第五章 特种文献检索第六章 Internet 网络信息资源第七部分:信息资源的综合利用与课程总结
2,学时数绪论、第一章、第二章共4.5学时,第三章4学时,第四章2学时,第五章2学时,第六章2学时,第七部分1.5学时。
二、各章知识点绪论一、信息时代对教育的支持和挑战人类历史上发生的五次信息技术革命:
第一次是语言的产生。
第二次是文字的出现。
第三次是造纸术和印刷术的发明。
第四次是电报、电话、电视的问世。
第五次信息技术革命是电子计算机和现代通讯技术的结合。
信息时代为现代教育提供了新的环境和条件,也对传统教育提出了挑战,特别是社会发展对教育理念、教学内容、教学工具和手段都有了新的要求,从而引起了整个教育的变革。
二、信息素质及其内涵
信息素质(Information Literacy)的概念:
(1)利用大量的信息工具及信息源,使问题得到解决或解答的技能。
(2)要成为具有信息素质的人,他必须能够确定何时需要信息,并且具有检索、评价和有效利用信息的能力。
信息素质的内涵包括:
信息意识:是指人们对信息的敏感程度信息能力:发现、评价、利用和交流信息的能力信息道德:在信息活动中应遵循的道德规范三、信息检索的意义和作用
(一)信息检索的意义
1.信息检索是获取知识的有效途径
2.信息检索是创新型人才应具备的基本技能
3.信息检索是继承借鉴前人成果的主要手段
(二)信息检索的作用
1.信息检索能够避免重复研究和走弯路
2.信息检索有助于节约时间、提高科研效率
3.信息检索是科学决策的必要前提
第一章 信息与信息资源第一节 信息的基本知识信息可是当代社会使用最多、最广、最频繁的词汇之一,它普遍存在于自然界、人类社会以及人类思维活动之中。信息的内涵丰富、形式多样,具有物质和能量资源所不具备的独特性质和专门功能。
在人类漫长的发展历程中,物质、能源和信息三种资源支配着人类最基本的生产活动。
物质 ----- 向人类提供材料及生活必需品信息 ----- 向人类提供知识和智慧能源 ----- 向人类提供动力一、信息的概念到目前为止,有关信息的定义尚无统一定论
1,信息的经典定义
1948年,美国数学家、信息论的创始人香农在题为“通讯的数学理论”的论文中指出:“信息是用来消除随机不定性的东西”。
1948年,美国著名数学家、控制论的创始人维纳在《控制论》一书中指出:“信息就是信息,既非物质,也非能量。”
2,信息的现代定义信息是指一切事物存在方式和运动规律的表征。它是事物的一种普遍属性,只要事物存在,就会有表征其属性的信息。它广泛存在于自然界和人类社会中,信息无处不在。人们正是通过自然界和人类社会中产生的不同信息来区别和认识各种事物的。它是人们认识世界和改造世界,取之不尽、用之不竭的宝贵资源。在人类进入信息社会的时代,信息已成为发展科技、经济、文化、教育的重要支柱之一。
尽管信息概念呈多样性,我们对信息的认识,一般可以从以下几个方面理解:信息与物质、能量既有区别又有联系;信息是事物变化和差异的表现;信息的获取,可以使主体对客体的不确定性减少。
二、信息的特征
1,信息的普遍性和客观性
2,信息认识的主观性
3,信息的依附性
4,信息的可传递性
5,信息价值的不定性
6,信息的共享性信息传递四要素:信源(信息的发出体)、信宿(信息的接收体)、信道(信息的传递媒介)、信息。
三、信息的功能
1,资源功能
2,组织管理功能
3,中介功能
4,消除不定性(解惑)功能
5,传播功能四、信息与知识、文献的关系
1.知识(Knowledge)
知识是人类对客观事物的认识和经验的总和,是人类对客观事物规律性的认识,是信息中最有价值的部分。知识一经产生就以声像信息、实物信息、文字信息等形式传播。人类不仅要通过信息认识世界,而且要根据所获得的信息组织知识。
知识与信息的关系:
知识是信息的一部分,不直接等同于信息。
知识是人类大脑活动的产物,是系统化、精炼化的信息。
信息是知识产生和形成的基础。
2,文献(Document)
文献是指记录有知识的一切载体。
文献由四个基本要素组成:
所记录的知识和信息,即文献的内容。
记录知识和信息的符号,文献中的知识和信息是借助于文字、图表、声音、图像等记录下来并为人们所感知的。
用于记录知识和信息的物质载体,如竹简、纸张、胶卷、胶片等,它是文献的外在形式。
记录的方式或手段,如铸刻、书写、印刷、复制、录音、录像等,它们是知识、信息与载体的联系方式(摘自《中国大百科全书·图书馆学情报学档案学》)。
文献具有认识、存储和交流知识的作用。
3,三者的关系可见,信息与知识之间的逻辑关系为包含与被包含的关系。知识是信息的一部分,文献是信息、知识的具体体现,它不仅是信息、知识的主要物质形式,也是读者吸收利用信息、知识的主要途径。
第二节 信息资源的基本知识一、信息资源(Information Resources)的概念国内外学者对信息资源概念的认识有两种具有代表性的观点:
狭义的理解:信息资源是人类社会经济活动中经过加工处理有序化并大量积累起来的有用信息的集合,如科技信息、政策法规信息、社会发展信息、市场信息等,都是信息资源的重要构成要素。
广义的理解:信息资源是人类社会信息活动中各种要素的集合。
二、信息资源的本质特性
1,知识性
2,共享性三、信息资源的类型
(一)按物质载体划分
1,纸质文献纸质文献是利用纸张作为存储介质,以手写、印刷为记录手段而产生的文献形式。包括油印、铅印、胶印、复印等印刷品及手稿。纸质文献历史悠久,至今仍是主要的文献形式。
2,非纸质文献
(1)缩微型文献:缩微型文献是以感光材料为存储介质,利用缩微照相技术使文献缩微化的一种文献类型,如缩微胶卷、缩微平片。
(2)声像型文献(视听资料):该种文献以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像,并以此传递信息。如唱片、录音带、录像带、电影胶片、幻灯片。
(3)电子文献:电子文献是指以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源。它包括数据库、电子图书、电子期刊、电子报纸以及Internet信息资源(WWW站点、网络新闻组、BBS、电子邮件等)。
发展趋势:由以纸质信息资源为主向以电子信息源为主发展。
(二)按出版类型划分
1.图书(Book)
凡篇幅达48页以上并构成一个书目单元的文献称为图书。
国际标准书号(ISBN)
2.连续性出版物连续出版物是指具有统一题名、定期或不定期以分册形式出版、有卷期或年月标识、计划无限期连续出版的文献。其主要特点是连续性、及时性和稳定性。它包括期刊、报纸、年度出版物及其他连续性报告、会议录、专著性丛刊等。在众多的连续性出版物中最具代表性的是期刊、报纸、年鉴。连续性出版物是与图书并列的最重要的文献类型。
(1)期刊(Journal Magazine periodical)
是指采用统一名称定期或不定期的连续性出版物。
具有连续的卷、期号或年、月顺序号。
ISSN (国际标准刊号)
核心期刊,是指某一学科中高水平、高影响力的期刊。
(2)报纸( Newspaper)
是指以刊载新闻和评论为主的连续性出版物,出版周期短(日、隔日、周报、旬报)有年、月、日顺序 。
(3)年度出版物(annual,yearbook)
汇集某领域年内重要资料,每年出版一次。它包括年报、年鉴及按年度出版、修订的百科全书等。
3.特种文献(special categories of documents)
(1)专利文献
(2)标准文献
(3)学位论文
(4)科技报告
(5)会议文献
(6)政府出版物
(7)产品资料
(8)档案
(三)按加工深度划分
1.零次文献指未经公开发表或未交流于社会的文献。如:私人笔记、设计草图、实验记录、论文草稿、会议记录、书信
2.一次文献一次文献也称原始文献,是指人们根据自己的科学实验、生产实践的成果而撰写的文献,一般指期刊论文、科技报告、会议论文、学位论文、专利等。
3.二次文献二次文献也称检索工具,是指对一次信息加工、整理后形成的各种检索工具,如目录、题录、文摘等,它不对一次信息提供评论,仅仅提供一次文献的检索线索,也就是说,二次文献是把一次文献从分散、无序的状态变成集中、有序化的状态,供人们迅速、准确地查询所需信息。
4.三次文献三次文献是指在利用大量一次文献的基础上,对其内容进行综合、分析、研究和述评而撰写出来的文献。分为综述研究类和参考工具类两种类型。前者如动态、综述、学科总结、专题述评等;后者如百科全书、年鉴、手册、科技词典、名录、手册等。三次文献源于一次文献,又高于一次文献,是一种再创性文献。
一次文献、二次文献、三次文献之间的关系:
从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走向有序、由一种有序结构演变为另一种完善的有序结构的过程。
四、网络信息资源迄今为止,对于“网络信息资源”尚没有统一的定义,类似的名称也很多,如“电子信息资源”(Electronic Information Resources)、“因特网信息资源”(Internet Information Resources)“联机信息”(On-line Information)、“万维网资源”(World Wild Web Resources)等。有关其定义也多种多样,如有人提出“电子信息资源是以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷纸质的载体中,并通过网络通信,计算机或终端等方式再现出来的信息资源”。网络信息资源,从字面上可以理解为“通过计算机网络可以利用的各种信息资源的总和”;从目的上看是“为了提高信息系统效率,实现资源共享而采用计算机网络整理、传递、获取的各种信息”;在范围上它不仅包括Internet上的信息资源,也包括各种局域网、城域网和广域网上的信息资源。
(一)按照网络信息的内容划分
1,网络数据库数据库亦称文献库、资料库,是发展最早、影响最广的一种主要电子信息源。脱离单机或专门的检索终端,与网络相结合,借助网络而提供服务的数据库即为网络数据库。网络数据库主要包括联机数据库和光盘数据库。
2,联机馆藏目录库图书馆作为信息的集散地,在网络的影响下纷纷向着数字化、网络化方向发展,为了使更多的读者充分利用图书馆资源并实现资源共享,众多图书馆建立了馆藏机读目录数据库并通过网络提供OPAC(Online Public Access Catalo)服务。
3,电子出版物网络上出现了越来越多的电子出版物,包括电子图书、电子期刊和电子报纸等。
4,政府机构信息政府机构以政府信息服务系统向公众提供信息。包括有关组织机构的宗旨、业务范围、人员、出版物、最新消息发布、各种法律、法规或相关政策信息等,内容相当广泛。
5,休闲娱乐信息这类资源较多,且大多免费提供给用户,包括各种新闻、广告、讨论组以及各种软件
(二)按照所采用网络信息的协议不同划分
1,基于超文本传输协议(HTTP)的信息资源万维网(World Wide Web,简称WWW或Web)信息资源是一种典型的基于HTTP的网络信息资源。Web建立在超文本、超媒体基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面(GUI)展现和提供信息的网络信息资源形式。由于其使用简单、功能强大,自20世纪90年代问世以来,成为发展最快、信息最丰富的一种网络信息资源形式。
2,基于文件传输协议(FTP)的信息资源
FTP协议的主要功能是完成从一个系统到另一个系统完整的文件复制,即在网络的联网计算机之间传输文件。通过FTP可以获得的信息资源类型很广泛。广义地说,任何以计算机方式存储的信息均可通过FTP协议获取,包括书籍、图像、声音、多媒体、一些书籍的电子版、电子期刊、某些政府机构发布的信息、大量的免费与共享软件等。
3,基于远程登录(Telnet)的信息资源这是指通过Telnet协议所访问到的网络信息资源。其实现方法为在远程计算机上登录,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问、使用远程计算机中对外开放的资源。这些资源包括硬件资源,如超级计算机,精密绘图仪,高速打印机,高档多媒体输入、输出设备等;也包括软件资源,如大型的计算机程序、图形处理程序以及大型数据库等信息资源。
第三节 我国文献信息的主要收藏及服务系统一、图书馆系统
1,公共图书馆系统
2,高校图书馆
3,科学研究系统图书馆二、国家科技信息系统三、专利文献系统四、标准文献系统五、档案系统第二章 信息检索技术与策略第一节 信息存储的基本知识信息存储是指利用一定的科学规则和方法,通过对信息的特征进行分析、表征和提炼,并按给定的参数和序列公式排列、存储在相应载体上,组织成系统化的具有检索功能的系统过程。
一、信息筛选信息筛选是对原始信息的挑选和鉴别,是建立信息资源检索系统的基础和保障。
信息筛选原则:针对性、系统性、预见性、科学性、计划性和及时性。
信息筛选方法:直观判断法、分析法、集体讨论法、专家裁决法、数学核算法、现场核实法等。
二、信息描述信息描述是指根据信息组织和检索的需要,依照一定的科学规则和技术标准,对信息的外部特征、物质形态和内容特征进行全面描述并给予记录的过程。
(一)信息外表特征的描述信息的外部特征是指信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征,它包含信息载体的物理形态、题名、加工者、出版或发表日期、流通或传播的标记等。
期刊论文的外表特征:文献的题目、著者、著者的工作单位、文献的出处(刊名、年卷期、起止页码)、语种、参考文献及图表的数量。
图书的外表特征:书名、著者(或编者、译者)、出版项(出版社、地点、时间)、稽核项(价格、页数、参考文献)、书号不同的检索系统(数据库)所描述的项目与标识符有所不同。
(二)内容特征的描述信息的内容特征就是信息包含的内容,它可以由分类号、主题词、关键词或其它知识单元来表达。
内容特征标引采用的方法主要有分类标引、主题标引。其中,分类标引是指对文献主题分析,用分类语言表达分析的主题,赋予文献分类检索标识(分类号)的过程;主题标引是指对文献进行主题分析,用主题语言(主题法)表达分析出的主题,赋予文献主题检索标识(主题词、叙词)的过程。
信息内容特征的标引较为复杂,必须借助于特定的信息检索语言。
三、信息检索语言信息检索语言是根据信息组织和信息检索的需要而创制的人工语言,又称信息组织语言、情报语言、标引语言、索引语言等。
(一)分类检索语言分类检索语言用分类号和类名来表达各种概念,将各种概念按学科门类的逻辑次序或事物的性质进行分类和系统排列。分类检索语言包括体系分类法和组配分类法。
1,体系分类法体系分类法是直接体现知识分类的等级制概念标识系统,它通过对概括文献信息内容及其某些外部特征的概念进行逻辑分类和系统排列而构成。
我国常见的体系分类法有《中国图书馆分类法》(简称中图法)、《中国科学院图书馆分类法》(简称科图法)、《中国人民大学图书馆分类法》(简称人大法);国外常见的体系分类法有《杜威十进分类法》(DC)、《国际十进分类法》(UDC)。
《中图法》是我国使用最为广泛的分类法,它分为5个基本部类、22个基本大类以及相应的二级类、三级类等。5个基本部类为:马克思主义、列宁主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书。采用英文字母与阿拉伯数字相结合的混合制号码,用一个字母表示一个大类,以字母的顺序反映大类序列,在字母后用数字表示大类下的类目划分。
体系分类法的主要特点是按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类角度检索文献信息的途径。
2,组配分类法组配分类法的原理是依据事物的性质,首先确定几个分类标准,即分面,再确定每个分类标准中的若干特征值,即类目,每一分面的类目与其他分面的类目分别组配,形成许多组配类目,达到细分的目的。
(二)主题检索语言主题检索语言是用语词作为概念标识,按字顺排列,并用参照系统等方法间接显示概念间相互关系的一种信息检索语言,也称主题法系统。
标题词语言(Heading) 受《词表》控制
单元词语言 (Uniterm) 受《词表》控制叙词语言( Descriptor ) 受《词表》控制关键词语言(Keyword) 无《词表》,不受《词表》控制
(三)主题检索语言与体系分类法的区别四 信息存储
1,数据库及其基础构成数据库(database)是“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”通俗地说,数据库就是在计算机存储设备上,按一定方式存储的相互关联的数据集合,是信息检索的基础。
一条信息记录(record)是由若干个款目所组成,每个款目称为一个字段(Field),字段是构成记录的基础;信息记录的集合就形成文档,一个数据库可以包含有一个文档,也可以含有若干个文档。文档也可以称为子数据库。
2,数据库记录的格式
“记录”(record)是数据库的基础成分,是对某一实体属性进行描述的结果,是组成文档的基本数据单位。每一条记录由三种类型的字段组成:检索系统存取号、基本索引字段和辅助索引字段。
举例:图书的记录格式
举例:期刊论文的记录格式
3,数据库的文档结构数据库的文档一般有顺排文档和倒排文档两种类型。
第二节 信息检索概述一、信息检索的发展历程及进展
(一)手工检索阶段
(二)机械检索阶段
(三)计算机检索阶段
1,脱机批处理检索
2,联机检索
3,光盘检索
4,网络检索二、信息检索的概念与原理信息检索(Information retrieval)是指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。信息检索是用户进行信息查询和获取的主要方式。
信息检索包括信息存储和信息检索两个部分信息检索流程图检索原理:检索提问标识与存储标引标识进行比较,两者一致或信息标引的标识包含着检索提问标识,则具有该标识的信息就从检索系统输出,输出的信息就是检索命中的信息。
三、信息检索的类型和方法
(一)信息检索类型
1,按检索内容划分
(1)文献检索:以文献线索为检索对象的检索。检索系统一般为书目、索引、文摘等二次文献。
(2)数据检索:以数值形式表示检索内容的信息检索。
(3)事实检索:以文献中抽取的事实为检索内容的信息检索。
(4)全文检索:以原始文献中所含的全部信息作为检索内容的信息检索,即是以文献全文作为检索内容的信息检索。检索的内容可以是全文,也可以是部分内容,并可进行各种频率的统计和内容分析,它通常用自然语言表达检索课题。
(5)图像检索:以有关人、事、物的形象,包括图像和图文信息为检索内容的信息检索。
(6)多媒体检索:多媒体检索通常是以文字、图像、数据和声音为检索内容的信息检索。
2,按信息检索手段划分
(1)手工信息检索
(2)计算机信息检索
(二)信息检索方法
1.工具法是指利用各种检索工具或数据库查找文献信息的方法。
(1)顺查法:以研究课题的起始年代为起点,由远及近,逐年查找,直至最近期为止。
(2)倒查法:针对研究课题,从最近期向早期回溯,直至查获适量切题文献信息为止。
(3)抽查法:抽查法是一种利用检索工具进行重点抽查检索的方法。
2.引文追溯法
利用文献所附的参考文献进行追溯查找。
3.循环法
是工具法与引文追溯法相结合的一种检索方法。
四、信息检索工具信息检索工具是用来存储、报道和检索文献线索的工具,具有存储和检索两个基本功能。
信息检索工具的类型按照不同的标准划分有不同的类型,最常用的一种划分方式就是按照著录内容划分,可以分为目录、题录、文摘三种。
第三节 现代信息检索策略一、分析检索课题,明确检索需求
1,分析课题学科属性、专业范围及相关内容
2,分析检索课题的信息类型和时间要求
3,明确用户自身的信息需求二、选择检索系统选择检索系统要考虑三方面的因素。一方面是检索课题的具体要求,包括所需要的学科、主题范围,对语种、年代、资源类型的要求,以及对查全、查准、查新方面的具体要求。另一方面,要考虑检索系统的类型和性能,包括其收录范围,报道内容及倾向、可获得性,存储年限、更新周期、所具有的检索功等方面。最后,要考虑检索者对检索系统的熟悉程度。综合上述几方面的考虑,选择匹配性最佳的检索系统。
三、确定检索途径
(一)以文献的外部特征为检索途径
1,题名途径
2,责任者途径
3,号码途径
(二)以文献信息的内容特征为检索途径
1.分类检索途径
2.主题检索途径四、选择检索词检索词是表达文献信息需求的基本元素,也是计算机检索系统中进行匹配的基本单元。选择检索词一般要考虑以下基本原则:
(1)所选检索工具有叙词表或主题词表的,优先选用叙词或主题词作为最基本的检索词;
(2)要从词表规定的专业范围出发,选用各学科内具有检索价值的基本名词术语;
(3)如选择的检索词无词表可查,或在词表中未反映,可选择自由词作为检索词;
(4)选词要适应待检数据库的检索用词规则;
(5)通常要选择常用的基本词汇进行匹配。
五、构造检索式
1.概念检索检索标识是具体的检索词或词组,每个检索词表达一个概念
2.布尔逻辑算符组配检索
是将多个检索词进行逻辑组配形成的一种复合性检索要求。
(1)逻辑与用符号,and” 或,*”表示,
其逻辑表达式为,A and B 或 A * B
其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。
(2)逻辑或用符号“or”或“+”表示,
其逻辑表达式为,A or B 或 A + B
其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。
(3)逻辑非用符号“not”或“–”表示,
其逻辑表达式为,A not B 或 A – B
其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。
3.位置逻辑算符
4.截词和屏蔽(模糊检索)
使用截词符(通配符):?,%,*,$
截词主要是利用检索词的词干或不完整的词形进行检索。
5.比较运算符
=等于,> 大于,< 小于,>= 大于等于,<= 小于等于
6.优先运算符
( ),‘……’,“……”
7.检索字段限定符
CNKI中国知网:专业检索某些外文数据库,TI=rice、AU=Li Hua
六、实施检索七、调整检索策略检索时,应及时分析检索结果是否与检索要求一致,如果不一致,则应对检索策略做相应的修改和调整,直至得到比较满意的结果。对检索结果的分析有如下三种情况:
1,检索结果信息量过多检索结果信息量过多的原因可能有:对所选的检索词的截词截得太短;未加字段限定或限定太过宽泛;使用了过多的相关词或上下位概念等。在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。
调整检索策略的方法如下:① 减少同义词与同族相关词。② 增加限制概念,采用逻辑“与”连接检索词。③ 使用字段限定,将检索词限定在某个或某些字段范围。④ 使用逻辑“非”算符,排除无关概念。⑤ 增加语种限制以及缩短检索期限。 调整位置算符,由松变严。⑦ 将截词的词根变长或减少截词算符的使用。
2,检索结果信息量过少
造成检索结果信息量少的原因有:选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;同义词、相关词、近义词没有运用全;上位概念或下位概念没有完整运用;字段限定太多;逻辑“与”、“非”用得过多;检索概念专指度过高等。这种情况要考虑扩大检索范围,提高检索结果的查全率。
调整检索策略的方法如下,① 选全同义词与相关词并用逻辑“或”将它们连接起来,增加网罗度。 ② 减少逻辑“与”和逻辑“非”的运算,丢掉一些次要的或者太专指的概念。 ③ 去除某些字段限制。④ 增加上位概念。⑤ 重新选择更合适的数据库。⑥ 调整位置算符,由严变松。⑦ 增加截词算符的使用。
3.检索结果中误检率过高错误率过高的原因可能有:检索词本身的多义性;主题词分析错误;使用了不规范的缩写。
调整检索策略的方法如下:① 对叙词进行相关的限定,如学科限定。② 提高用户分析课题的能力,确定核心检索词。③ 尽量少使用全文字段检索。④ 正确使用缩写词。
通过对检索策略的不断优化,从而使我们最终得到满意的检索结果。
八、获取原始文献获取全文的途径:首先是查找本单位购买的全文数据库;其次可利用那些提供流量计费下载的全文数据库网站获取;第三,向文献收藏单位联系馆际互借或文献传递;第四,可直接向作者索取;最后,都找不到的情况下,可向出版发行单位购买。
第四节 检索效果评价检索效果评价主要是指信息检索的最终结果是否满足用户需求或满足程度如何。
一、检索效果评价指标常用的评价指标有:查全率、查准率、漏检率、误检率、响应时间、用户负担和输出形式等,其中最常用的指标是查全率和查准率。
1,查全率(Recall ratio)与漏检率(Omission ratio)
查全率是用来描述系统检出相关文献能力的一种尺度,是指检索出的相关信息量与信息系统中的相关信息总量之比,其计算公式为:
查全率(R )=×100%
漏检率是指未被检出的相关信息量与信息系统中的相关信息总量之比,其计算公式为:
漏检率(O )=×100%
2,查准率(Precision ratio)与误检率(Fall-out ratio)
查准率是用来描述检索精确度的指标,是指检索出的相关信息量和检索出的信息总量之比,其计算公式为:
查准率(P )=×100%
误检率是指检索出的非相关信息量和检索出的信息总量之比,其计算公式为:
误检率(F )=×100%
二、影响检索效果的因素
(一)检索工具质量
存储文献是否齐全,索引系统是否完善,标引过程中失误率及标引深度(标引时分析文献所达到的深度),标引的全面程度等等,都对查全率和查准率有着很大的影响。
(二)标引语言与检索语言的一致性文献信息检索是将检索标识与文献标识进行匹配比较的过程。为了达到二者的匹配,检索者使用的语言必须与文献标引语言相一致,即必须使用检索工具中所采用的语言,否则,就达不到预期的效果,漏检率会增大。
(三)检索者的熟练程度文献信息检索专业性很强,检索人员必须熟悉相关专业知识,才能准确分析课题,制定合适的检索策略,获得良好的检索效果。因此,检索者应该熟悉检索工具和检索方法,了解检索工具的收录范围及提供的检索途径,以便灵活处理各种情况,提高检索效率。
(四)检索策略正确的检索策略及检索表达式可以优化检索过程,有助于提高查全率及查准率,取得最佳的检索效果。
用单个词检索时会有较高的查全率和较低的查准率;用几个单词进行组配检索时将会有较高的查准率,但查全率会下降。
在自然语言存在大量同义词与近义词、学名与俗称、新称与旧称、全称与简称、单数与复数这类词必须视为与检索词等同的词,才能保证查全率。自然语言中还存在大量的多义词,也会影响查准率。
三、提高检索效果的措施提高检索效果,一是要提高查全率和查准率,二是降低漏检率和误检率。针对上述影响因素,提出如下措施:
1.提高检索工具的编辑质量
2.准确使用检索语言
3.提高检索者的水平,制定最优检索策略
第三章 中文文献数据库检索第一节CNKI中国学术期刊网络出版总库一、简介
(一)CNKI(国家知识基础设施)工程简介提出:1998年世界银行提出全称/简称,国家知识基础设施(National Knowledge Infrastructure/ CNKI )
发起,由清华大学、清华同方发起始建,1999年6月
(二)重点数据库介绍(要求学生知道收录的数据库名称)
CNKI 系列源数据库:
中国期刊全文数据库(含世纪期刊)
中国博士学位论文全文数据库中国优秀硕士学位论文全文数据库中国重要报纸全文数据库中国重要会议论文全文数据库中国图书全文数据库二、中国期刊全文数据库
1.数据库简介期刊总数(8200 余种)、文献总量(2700 余万篇)、更新周期(中心网站日更新)、
全文质量(PDF全文数据格式)、时间范围(1994年----)、
学科范围(10个专辑168个专题3600个子栏目)、多种产品形式、……
检索主界面介绍
2.检索方式:文献检索、期刊导航(注具体的检索方式按当时数据库的最新检索方式进行介绍,以下所有数据库相同)
3.检索结果处理显示、标记、保存、打印、电邮全文(CAJ/PDF/TXT格式、打开/保存)
第二节 中文科技期刊数据库一、简介
1.维普信息资源系统简介维普信息资源系统是由重庆维普资讯有限公司研制开发的网络信息资源。
2.维普信息资源系统数据库:
《中文科技期刊数据库》(全文版)
《中文科技期刊数据库》(文摘版)
《中文科技期刊数据库》(引文版)
《外文科技期刊数据库》(文摘版)
《中国科技经济新闻数据库》
《中国企业及产品广告数据库》
3.中文科技期刊全文数据库简介期刊总数(8000 余种)、核心期刊(1810 种)、文献总量(2000 余万篇)、
更新周期(中心网站日更新)、全文质量(PDF全文数据格式)
时间范围(1989年至今)、学科范围(8个专辑28个专题)、检索方式(5种)
著录标准(中图法/检索期刊条目著录规则)、服务方式(5种)……
二、中文科技期刊全文数据库检索检索主界面介绍检索方式:快速、传统、高级、分类、期刊导航检索三、检索结果处理显示、标记、下载、打印、电邮、加入电子书架、我的数据库题录、文摘、全文(PDF格式/纯文本格式)
第三节 万方数据资源检索系统一、简介
1.万方数据股份有限公司万方数据股份有限公司是由中国科技信息研究所以万方数据(集团)公司为基础,联合山西漳泽电力股份有限公司、北京知金科技投资有限公司、四川省科技信息研究所和科技文献出版社发起组建的高新技术股份有限公司。
2.数据资源简介中国数字化期刊群、中国学术会议论文全文数据库(中文版)、中国学位论文全文数据库、中国标准全文数据库、科技信息子系统、商务信息子系统、外文文献数据库二、数据库检索
1.单库检索,
2.跨库检索:经典检索、专业检索三、检索结果处理显示、下载
第四节 人大复印报刊资料全文数据库检索一、数据库简介
简介、收录范围、收录时间、资源列表二、数据库检索数据库检索主界面检索方式:浏览检索、查询、高级查询、二次检索三、检索结果处理
显示:单篇显示、多篇显示
用户定制:标题定制、全文定制、排序、
检索历史、打印、保存全文全文格式:TXT格式
第五节 超星数字图书馆一、超星数字图书馆
1.简介超星数字图书馆由北京世纪超星信息技术发展有限责任公司投资兴建,2000年1月在互联网上正式开通。其内容包括文学、历史、法律、军事、经济、科学、医药、工程、建筑、交通、计算机和环保等几十个分馆,收录年限为1977年至今。
2.数据库检索
检索方式:快速检索、分类检索、高级检索
3.检索结果处理显示、阅读、下载、打印、收藏到我的图书馆二、读秀学术搜索
1.简介读秀学术搜索是由海量图书等文献资源组成的庞大的知识系统,是一个可以对文献资源及其全文内容进行深度检索,并且提供原文传送服务的平台。
2.检索方法
基本检索、高级检索
3.检索结果处理显示、阅读、文献传递
第六节 其他中文数据库一、书生之家数字图书馆二、方正阿帕比(Apabi)电子图书三、中国科学引文数据库四、中文社会科学引文数据库五、图书馆书目数据库
第四章 外文文献数据库检索第一节 世界三大农业数据库一、概述世界三大农业数据库是指CAB Abstracts、AGRIS、AGRICOLA
CABI是国际应用生物科学中心的缩写,其前身是CAB,即1928年成立的皇家农业局;CAB Abstracts是CABI出版的二次文献数据库(目前有部分全文),是世界上最大的农业文献数据库。
AGRIS数据库是由联合国粮农组织(FAO)所属的国际农业科技情报系统编辑的书目数据库。该数据库的学科范围包括农业、林业、畜牧业、渔业、食品科学、地球科学、环境科学、农业工程、人口、经济、法律、教育等。AGRICOLA数据库是由美国农业图书馆(NAL)、食品与营养信息中心(FNIC)、美国农业经济文献中心(AAEDC)等机构联合编辑的数据库。该数据库主题范围包括农、林、牧、水产、兽医、园艺、土壤等整个农业科学领域及动物、植物、微生物、昆虫、生态等生命基础科学及环境科学、食品科学。引用文献类型除期刊论文等连续出版物之外,还包括专著、学位论文、计算机软件、技术报告、专利、声像资料等。
二、检索方式简要介绍OVIDSP中数据库进入主页界面方法和主页界面。
OVIDSP检索相关检索技术(或技巧):布尔表达方式及应用、位置运算符应用方法、截词和通配符的应用等;字段限制检索的语法格式,常用字段缩写表达。
OvidSP的5种检索方法 (要求知道中英文名称)
三、OvidSP中检索结果处理的基本方法和步骤
第二节 EBSCOhost全文数据库
EBSCO Publishing 是美国的一家私人公司,创建于1948年,1986年开始发行电子产品,1994年开始在Internet 上提供在线服务。EBSCOhost是该公司推出的三大数据系统之一,也是目前世界上比较成熟的全文检索数据库之一,共包括60多个专项数据库,其中全文数据库10余个。
一、数据库概述(以ASP、BSP为例介绍)
ASP(Academic Search Premier)学术期刊数据库的简称,由EBSCO Publishing公司出版,是世界上最大的多学科学术数据库,提供近4700多种学术出版物的全文,包括3100多种同行评审期刊的全文。收录几乎覆盖学术研究的每个领域,并且所提供的内容信息最远可追溯至1975年。此数据库每日更新。
BSP(Business Source Premier)商业资源数据库的简称,由EBSCO Publishing公司出版,这是业界使用最多的商业研究数据库,提供 2300多种期刊的全文。与商业相关的所有主题范围几乎均包括在内。此数据库每日更新。
二、检索方法简要介绍该数据库进入主页界面方法和主页界面。
该数据库检索相关检索技术(或技巧):布尔表达方式及应用、位置运算符应用方法、截词和通配符的应用等;字段限制检索的语法格式,常用字段缩写表达。
检索方法(基本检索、高级检索、视觉搜索的中英文名称应该知道)的步骤及相关检索技术的灵活应用技巧。
第三节 ProQuest全文数据库
ProQuest是ProQuest Information and learning公司(原名UMI/Bell & Howell)推出的全文检索系统,为用户在网上进行多文档检索并随时获取全文提供了方便。该公司成立于1938年,是全球最大的文献信息服务公司之一,也是美国学术界著名的出版商。
该公司的信息遍及世界,其出版物收录了20000多种外文期刊、7000多种报纸、150多万篇硕、博士论文、20多万种绝版书及研究专集,内容覆盖1000多个学科和专业。目前我校图书馆购买的数据库主要有农业和生物科学两种。
检索技术(或技巧):布尔表达方式及应用、位置运算符应用方法、截词和通配符的应用、双引号表达意义等检索方法:基本检索、高级检索、主题和出版物检索(中英文名称应该知道)
第四节 ScienceDirect电子期刊全文数据库
ScienceDirect是Elsevier Science公司的核心产品。Elsevier Science是一家总部设在荷兰的历史悠久的跨国科学出版公司,所出版的期刊是世界上公认的高品位学术期刊,且大多数为核心期刊,被世界上许多著名的二次文献数据库所收录,其中60%以上的期刊被SCI收录。
第五节 其它外文数据库一、Web of Science
二、Cell Press Journals
三、SpringerLink
四、Wiley InterScience
五、MEDLINE
六、EMBASE.com
七、Engineering Village 2
八、SciFinder Scholar
九、BIOSIS Previews
十、Food Science and Technology Abstract
十一、LexisNexis Academic学术大全数据库十二、NetLibrary电子图书十三、Dialog国际联机检索系统
第五章 特种文献检索第一节 专利文献及其检索一、专利概述
1.专利的概念
“专利”一词从不同的角度,具有三种含义:
(1)专利就是专利权的简称,是指从法律角度所认定的权利。
(2)专利是指取得专利权并受到专利权保护的发明创造,是从专利权客体的角度来阐述专利的含义。
(3)专利是指专利文献。从专利公开的形式来说,专利是指记载享有专利权的发明创造内容的专利文献。通常说的“查专利”就是指查专利文献。
2.专利权的特征独占性、地域性、时间性
3.专利的类型
(1)发明专利(保护期限20年):是指对产品、方法或者其改进所提出的新的技术方案。因此,发明专利分为产品发明、方法发明和用途发明。发明专利是三种专利中最重要的一种。
(2)实用新型专利(保护期限10年):是指对产品(包括机器、设备、用具等有形物)的形状、构造或其组合所提出的适于实用的新技术方案。这种新的技术方案能够在工业上制造出具有使用价值和实用用途的产品。由于实用新型专利的创造水平低于发明专利,人们常称之为“小发明”或“小专利”。
(3)外观设计专利(保护期限10年):外观设计亦称为工业品外观设计,是指对产品的形状、图案或者其结合以及色彩与形状、图案的结合所作出的富有美感并适于工业应用的新设计。
4.获得专利权的条件
(1)新颖性新颖性是发明和实用新型能否获得专利权的首要条件。我国《专利法》第二十二条对新颖性定义为:新颖性是在申请之日以前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其它方式为公众所知,也没有同样的发明或者实用新型由他人向专利局提出过申请记载在申请日以后公布的专利申请文件中。
(2)创造性创造性是发明和实用新型取得专利权的另一个实质性条件。创造性是指与申请前已有的技术相比,该发明或者实用新型有突出的实质性特点和显著的进步。
(3)实用性实用性是指该发明或实用新型能够制造或者使用,并且能够产生积极效果。
5,专利制度的作用
(1)保护与鼓励发明创造
(2)有利于新技术的交流与传播
(3)鼓励与促进新技术的开发及应用
(4)有利于鼓励、吸引国外投资二、专利文献概述
1,专利文献的概念专利文献是指各国专利局(知识产权局)及国际专利组织在受理审批专利过程中产生的官方文件及其出版物的总称。作为公开出版物的专利文献主要有:专利说明书、专利公报、专利索引等。狭义的专利文献仅指专利说明书。
2.专利文献的特点新颖性、广泛性、规范性、快速性、重复性三、国际专利分类表(IPC)
1,IPC是欧洲理事会编制的专利分类表,是类分专利文献和通过主题来检索专利文献的重要工具。
2,IPC1968年9月1日第一版IPC生效,每5年修订一次。
3,IPC采取功能分类和应用分类结合、以功能分类优先的原则,并采用等级分类体系,将技术内容按部、分部、大类、小类、主组、分组逐级分类,组成一个完整的分类系统。
IPC共分8个部,20个分部,100多个大类,600多个小类,5.8万多个主组与分组。部的类号用大写字母A—H表示,分部无类号标识。
四、中国专利文献检索
1.专利公报中国专利公报是中国专利局的官方出版物,专门公布和公告与专利申请、审查、授权有关的事项和决定,是检索中国专利文献的主要检索工具。专利公报分为“发明专利公报”、“实用新型专利公报”、“外观设计专利公报”三种,均于1985年创刊,周刊,采用摘要的形式报道,附有专利公报索引和年度索引。1992年8月起,上述三种专利公报均被收入“中国专利文献数据库”。
2.专利索引
《中国专利索引》自1986年以来由中国专利出版社逐年出版,收集了1985年4月1日我国专利法实施以来在三种专利公报上公布的所有中国专利信息条目,该索引为题录型检索工具,1986-1992年间每年出版一次,从1993年起,每半年出版一次,每次出版分两个分册,第一分册为分类年度索引,按国际专利分类表或国际外观设计分类号顺序排列;第二分册为申请人、专利权人年度索引,按申请人、专利权人名称的汉语拼音顺序排列。
《中国专利索引》和《专利公报》可单独使用,也可配合使用。
3.中国专利文献数据库五、国外专利文献检索
1.德温特出版公司《世界专利索引》(World Patent Index,简称WPI)
2.网上专利信息检索
Internet上有丰富的专利文献信息源,除了DIALOG、STN等著名的联机网络检索系统提供的专利文献服务外,还有许多其他可获取专利文献信息的网站。
第二节 标准文献及其检索一、标准文献概述
1.标准的概念标准就其具体涉及的范围而言,主要是指对工农业产品和工程建设的质量、规格及其检验方法等所作出的技术规定。
2.标准文献的概念标准文献主要是指与技术标准、生产组织标准和管理标准相关的文献,也包括国家颁布的环境保护法、森林法、消费品安全保障法、药典、政府标准化管理机构的有关文件以及与标准化工作相关的其他文献。标准文献的主体是标准。
标准文献除了以标准命名外,还常以规范、规程、建议等名称出现。国外标准文献常以Standard(标准),Specification(规格、规范),Rules、Instruction(规则),Practice(工艺),Bulletin(公报)等命名。
3.标准文献的类型
(1)按标准的使用范围划分:国际标准、区域标准、国家标准、行业标准、地方标准、企业标准
(2)按照标准的性质划分:技术标准、工作标准、管理标准
(3)按照标准的成熟程度划分:法定标准、推荐标准、试行标准二、中国标准文献检索
1.印刷型检索工具:《中国国家标准汇编》、《中国标准化年鉴》、《世界标准信息》、《中华人民共和国国家标准目录及信息汇总》
2.主要网站:中国标准服务网、中国标准化信息网、中国国家标准咨询服务网、国家标准化管理委员会三、国际标准及其检索
1.国际标准:
国际标准主要是指国际标准化组织的标准(ISO标准)和国际电工委员会的标准(IEC标准)和国际电信联盟的标准(ITU标准),此外还包括国际标准组织认可的其他27个国际组织制定的标准。
2.国际三大标准组织
(1)国际标准化组织(简称ISO)
(2)国际电工委员会(简称IEC)
(3)国际电信联盟(简称ITU)
3.国际标准文献检索的主要数据库及网站美国IHS标准数据库、ISO网站、IEC网站、美国国家标准学会
第三节 会议文献及其检索一、会议文献概述会议文献是指在各种会议上宣读提交的论文、产生的记录及发言、论述、总结等形式的文献。许多学科中的新发现、新进展、新成就以及提出的新研究课题和新设想,都是以会议论文的形式向公众首次发布的。会议文献具有以下特点:内容新颖、及时性强;学术水平高、专业性强;数量庞大,内容丰富;可靠性强;出版形式多种多样。
二、会议文献检索
第四节 学位论文及其检索一、学位论文概念学位论文是高校和研究机构的本科生、研究生为获取学位资格而撰写的学术论文。
二、学位论文检索
第五节 科技报告及其检索一、概念科技报告是指科研工作成果的正式报告或研究过程进展情况的技术文献。
二、科技报告的分类三、科技报告的检索
第六章 Internet网络信息资源检索第一节 Internet基础知识一、Internet的起源与发展纵观Internet的发展历史,它经历了如下三个发展阶段:
1,ARPAnet的诞生
2,NSFnet的出现
3.现代Internet的产生二、Internet在中国中国的四大骨干互联网
(1)中国科学技术网(CSTNet)
(2)中国金桥信息网(ChinaGBN)
(3)中国公用计算机互联网(CHINANET)
(4)中国教育和科研计算机网(CERNET)
三、Internet的基本概念
1,TCP/IP协议
(1)TCP/IP协议的作用:是Internet保证各种不同类型的计算机网络实现相互通信一套规则或协议。
(2)TCP协议的概念和用途:TCP是传输控制协议,规定传输信息怎样分层、分组和在线路上传输。
(3)IP协议的概念和用途:是网际协议,定义Internet上计算机之间的路由选择,把不同网络的物理地址转换为Internet地址。
2,IP地址和域名
(1)IP地址的概念:Internet上的众多计算机和信息资源必须通过名字和地址来进行识别,接入Internet的计算机或节点被赋予一个惟一的数字作为地址,称为IP地址,用小数点隔开的四组数字组成。
(2)域名的概念和结构:Internet中每台计算机的域名结构为主机名、机构名、网络名、最高层域名。
3,URL(统一资源定位器)
URL是信息在网上的地址,可以将世界上所有的联机信息资源组织成有序结构,用来定位和检索WWW上的文档。它的格式有三部分组成:第一部分是协议(或称服务方式),大部分Internet文档用http,其他常用的协议有ftp、nntp、gopher、telnet等;第二部分是存有该资源的主机IP地址;第三部分是主机资源的具体地址。
四、Internet提供的信息服务
1,WWW信息服务
2,远程登录(Telnet)
3,文件传输协议(FTP)
4,电子邮件(E-Mail)
5,网络新闻服务(Network News)
6,Gopher信息服务
7,博客(Blog)与RSS
第二节 网络检索工具一、网络检索工具的组成网络检索工具由三个部分组成:数据采集子系统、数据组织子系统和用户检索子系统。
二、网络检索工具的类型
1,按检索机制划分根据检索工具的数据检索机制,可将检索工具分为检索型、目录型和混合型三种类型。
2,按检索内容划分根据检索工具的数据内容,一般可将检索工具分为综合型、专题型和特殊型三种。
3,按包含的检索工具数量划分根据检索工具数量划分为单独型的检索工具和集合型的检索工具。
4,按检索资源类型划分根据检索工具针对的数据资源类型,可分为万维网检索工具和非万维网检索工具。
第二节 常用搜索引擎及专业网站搜索引擎:广义上是指一种基于Internet上的查询系统,包括信息存取、信息管理和信息检索;狭义上是指一种为搜索Internet上的网页而设计的检索软件。
一、中文搜索引擎
(一)Google中文版
1,简单搜索关键词搜索技巧:
(1)不支持截词,但可以在搜索时使用通配符*,而且包含“*”必须用""引起来,这在搜索诗词时特别有效。如:“床前明**”
(2)对大小写不敏感。
(3)最常用的字符以及数字和单个字母等高频词,在检索时系统自动忽略不作检索,称为禁用词,如果必须检索禁用词时可用,”。如:“www”
(4)支持布尔逻辑运算,逻辑与检索无需添加and,两词间空格默认and匹配;逻辑或检索必须用大写OR连接关键词;逻辑非检索用-表示,但减号之前必须留一空格,不能使用not表示。
(5)短语或词组检索可用“”限制短语或词组的完整性。
(6)“~”符号搜索近(同)义词。如:输入~management,结果中不仅包括management,还包括“manager”、“administration”等词的页面。
(7)拼音汉字转换。Google 运用智能软件系统对拼音关键词能进行自动中文转换并提供相应提示。例如:搜索“shang wu tong”,Google 能自动提示,您是不是要找:商务通”。 并能支持模糊拼音搜索,为用户提示最符合的中文关键词。
(8)一些算符的使用:define、link、filetype、inanchor、intext、intitle、inurl、site、related
2.高级搜索
3.模块搜索
4.帮助工具手气不错、使用偏好、网页翻译、语言工具、网页快照、类似网页
(二)百度
1.简单搜索关键词搜索技巧:
(1)对大小写敏感。当以大写字母查询时,默认为精确匹配,即查询结果不包括小写的关键词;而以小写字母查询时,则同时查找大写和小写。
(2)最常用的字符以及数字和单个字母等高频词,在检索时系统自动忽略不作检索,称为禁用词,如果必须检索禁用词时可用,,。
(3)支持布尔逻辑运算,逻辑与检索无需添加and,两词间空格默认and匹配;逻辑或检索用 | 连接关键词;逻辑非检索用-表示,但减号之前必须留一空格。
(4)短语或词组检索可用“”限制短语或词组的完整性。
(5)书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,而在百度,中文书名号是可被查询的。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。
(6)支持算符的应用,如:filetype、intitle、inurl、site。
2.高级搜索
3.模块搜索
4.百度帮助
(三)中国雅虎
(四)搜弧二、英文搜索引擎
(一)AltaVista
AltaVista是功能全面、搜索精度较高的全文搜索引擎之一。截止2002年6月,AltaVista宣称其数据库已存有11亿个Web文件,并且经过升级,其搜索精度已达业界领先水平。允许以25种不同的语言进行搜索,并提供英、法、德、意、葡萄牙、西班牙语双向翻译。
(二)Excite
Excite是一个基于概念性的搜索引擎,它在搜索时不只搜索用户输入的关键字,还可“智能性”地推断用户要查找的相关内容进行搜索。它建立了一个收集有5500万网页的新闻组数据库,还每天搜索300个新闻媒体,将有关内容组织到新闻文章索引数据库。
(三)Lycos
Lycos创建于1995年,是搜索引擎的元老,最早提供信息搜索服务的网站之一。Lycos提供有18大类目录总共超过25万个网站查询,并且每周添加并更新内容,同时提供了网站、网页、新闻、小说全文阅读、产品、FTP、MP3、多媒体(图片,音频和视频文件)等多功能的搜寻服务。
三、常用农业生物专业网站
1,美国国家农业图书馆(NAL)
2,联合国粮农组织(FAO)
3,国际应用生物科学中心(CAB International)
4,欧洲农业网
5,欧洲生物信息研究所(EBI)
6,美国国家生物技术信息中心(NCBI)
8,PSD数据库
9,中国农业信息网
10,中国农业科技信息网
第四节 开放存取信息资源的利用什么是开放存取?
《布达佩斯开放获取计划》(BOAI)中给出的“开放存取”的定义:对文献的“开放存取”不应存在不同的政策和权限,用户可以通过Internet免费阅读、下载、复制、传播、打印和检索作品,实现对作品全文的链接,为作品建立索引,将作品作为数据传递给相应软件,或者进行任何其他出于合法目的的使用。而这些使用方式除网络本身的物理障碍和出于对作者著作权保护的考虑外,不应受经济、法律和技术的任何限制。
第五节 学科信息门户网站资源利用一、学科信息门户的概念学科信息门户(Subject Information Gateway,SIG)是一种专业性网站,为研究人员、教师和研究生提供高质量的、经过筛选和定期更新的学科信息目录和入口。图书馆员和学科专家对互联网上同一个学科有关的资料(期刊、图书、数据库和软件等)进行系统的整理和规范加工,形成可供用户检索和浏览的目录数据库,为科研和教学提供权威可靠的网络信息导航服务。
二、国内代表性的学科信息门户网站
1,中国科学院国家科学图书馆学科门户网站(http://www.csdl.ac.cn/)
2,国家科技图书文献中心热点门户(http://www.nstl.gov.cn/index.html)
第七章 信息资源的综合利用第一节 文献信息资源的搜集与整理一、搜集原则与方法
1.搜集原则及时性原则、系统性原则、针对性原则、计划性原则
2,信息搜集常用方法系统文献检索、跟踪最新信息二、文献信息的整理与组织
(一)文献信息的鉴别
1,可靠性
2,新颖性
3,适用性
(二)文献信息的整理
1,分类整理
2,主题整理
3,名称整理
4,号码整理
5,时间整理
6,地区整理三、文献信息的阅读策略
1.先读文摘,后读原文
2.先粗读,后精读
3.先读综述性文献,后读专题
4.先读现刊,后读过刊
5.优先阅读核心期刊、专业期刊四、文献信息的分析
第二节 学术论文写作
科技论文的结构科技论文的主要结构要素包括前置、主体和附属三个部分。题名、作者、摘要和关键词为前置部分,引言、正文和结论、参考文献为主体部分,附录为附属部分。
第三节 个人信息管理工具随着信息资源日益丰富和需求不断提升,用户迫切需要一个既能方便使用和管理,又可满足多种功能要求的管理工具来统筹管理各种文件和资料。能够实现这些功能并能起到事半功倍效果的软件,我们称之为个人信息管理工具。目前,用于个人信息管理的软件有很多,国外常见的有EndNote、Reference Manager、ProCite以及基于网络的Refworks等,国内常见的有NoteExpress、文献之星、医学文献王、PowerRef等。
课程总结
(2009-3)
一、讲授内容及学时数
1.内容绪论第一章 信息与信息资源第二章 信息检索基础知识第三章 中文主要信息资源检索系统第四章 外文信息检索系统第五章 特种文献检索第六章 Internet 网络信息资源第七部分:信息资源的综合利用与课程总结
2,学时数绪论、第一章、第二章共4.5学时,第三章4学时,第四章2学时,第五章2学时,第六章2学时,第七部分1.5学时。
二、各章知识点绪论一、信息时代对教育的支持和挑战人类历史上发生的五次信息技术革命:
第一次是语言的产生。
第二次是文字的出现。
第三次是造纸术和印刷术的发明。
第四次是电报、电话、电视的问世。
第五次信息技术革命是电子计算机和现代通讯技术的结合。
信息时代为现代教育提供了新的环境和条件,也对传统教育提出了挑战,特别是社会发展对教育理念、教学内容、教学工具和手段都有了新的要求,从而引起了整个教育的变革。
二、信息素质及其内涵
信息素质(Information Literacy)的概念:
(1)利用大量的信息工具及信息源,使问题得到解决或解答的技能。
(2)要成为具有信息素质的人,他必须能够确定何时需要信息,并且具有检索、评价和有效利用信息的能力。
信息素质的内涵包括:
信息意识:是指人们对信息的敏感程度信息能力:发现、评价、利用和交流信息的能力信息道德:在信息活动中应遵循的道德规范三、信息检索的意义和作用
(一)信息检索的意义
1.信息检索是获取知识的有效途径
2.信息检索是创新型人才应具备的基本技能
3.信息检索是继承借鉴前人成果的主要手段
(二)信息检索的作用
1.信息检索能够避免重复研究和走弯路
2.信息检索有助于节约时间、提高科研效率
3.信息检索是科学决策的必要前提
第一章 信息与信息资源第一节 信息的基本知识信息可是当代社会使用最多、最广、最频繁的词汇之一,它普遍存在于自然界、人类社会以及人类思维活动之中。信息的内涵丰富、形式多样,具有物质和能量资源所不具备的独特性质和专门功能。
在人类漫长的发展历程中,物质、能源和信息三种资源支配着人类最基本的生产活动。
物质 ----- 向人类提供材料及生活必需品信息 ----- 向人类提供知识和智慧能源 ----- 向人类提供动力一、信息的概念到目前为止,有关信息的定义尚无统一定论
1,信息的经典定义
1948年,美国数学家、信息论的创始人香农在题为“通讯的数学理论”的论文中指出:“信息是用来消除随机不定性的东西”。
1948年,美国著名数学家、控制论的创始人维纳在《控制论》一书中指出:“信息就是信息,既非物质,也非能量。”
2,信息的现代定义信息是指一切事物存在方式和运动规律的表征。它是事物的一种普遍属性,只要事物存在,就会有表征其属性的信息。它广泛存在于自然界和人类社会中,信息无处不在。人们正是通过自然界和人类社会中产生的不同信息来区别和认识各种事物的。它是人们认识世界和改造世界,取之不尽、用之不竭的宝贵资源。在人类进入信息社会的时代,信息已成为发展科技、经济、文化、教育的重要支柱之一。
尽管信息概念呈多样性,我们对信息的认识,一般可以从以下几个方面理解:信息与物质、能量既有区别又有联系;信息是事物变化和差异的表现;信息的获取,可以使主体对客体的不确定性减少。
二、信息的特征
1,信息的普遍性和客观性
2,信息认识的主观性
3,信息的依附性
4,信息的可传递性
5,信息价值的不定性
6,信息的共享性信息传递四要素:信源(信息的发出体)、信宿(信息的接收体)、信道(信息的传递媒介)、信息。
三、信息的功能
1,资源功能
2,组织管理功能
3,中介功能
4,消除不定性(解惑)功能
5,传播功能四、信息与知识、文献的关系
1.知识(Knowledge)
知识是人类对客观事物的认识和经验的总和,是人类对客观事物规律性的认识,是信息中最有价值的部分。知识一经产生就以声像信息、实物信息、文字信息等形式传播。人类不仅要通过信息认识世界,而且要根据所获得的信息组织知识。
知识与信息的关系:
知识是信息的一部分,不直接等同于信息。
知识是人类大脑活动的产物,是系统化、精炼化的信息。
信息是知识产生和形成的基础。
2,文献(Document)
文献是指记录有知识的一切载体。
文献由四个基本要素组成:
所记录的知识和信息,即文献的内容。
记录知识和信息的符号,文献中的知识和信息是借助于文字、图表、声音、图像等记录下来并为人们所感知的。
用于记录知识和信息的物质载体,如竹简、纸张、胶卷、胶片等,它是文献的外在形式。
记录的方式或手段,如铸刻、书写、印刷、复制、录音、录像等,它们是知识、信息与载体的联系方式(摘自《中国大百科全书·图书馆学情报学档案学》)。
文献具有认识、存储和交流知识的作用。
3,三者的关系可见,信息与知识之间的逻辑关系为包含与被包含的关系。知识是信息的一部分,文献是信息、知识的具体体现,它不仅是信息、知识的主要物质形式,也是读者吸收利用信息、知识的主要途径。
第二节 信息资源的基本知识一、信息资源(Information Resources)的概念国内外学者对信息资源概念的认识有两种具有代表性的观点:
狭义的理解:信息资源是人类社会经济活动中经过加工处理有序化并大量积累起来的有用信息的集合,如科技信息、政策法规信息、社会发展信息、市场信息等,都是信息资源的重要构成要素。
广义的理解:信息资源是人类社会信息活动中各种要素的集合。
二、信息资源的本质特性
1,知识性
2,共享性三、信息资源的类型
(一)按物质载体划分
1,纸质文献纸质文献是利用纸张作为存储介质,以手写、印刷为记录手段而产生的文献形式。包括油印、铅印、胶印、复印等印刷品及手稿。纸质文献历史悠久,至今仍是主要的文献形式。
2,非纸质文献
(1)缩微型文献:缩微型文献是以感光材料为存储介质,利用缩微照相技术使文献缩微化的一种文献类型,如缩微胶卷、缩微平片。
(2)声像型文献(视听资料):该种文献以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像,并以此传递信息。如唱片、录音带、录像带、电影胶片、幻灯片。
(3)电子文献:电子文献是指以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源。它包括数据库、电子图书、电子期刊、电子报纸以及Internet信息资源(WWW站点、网络新闻组、BBS、电子邮件等)。
发展趋势:由以纸质信息资源为主向以电子信息源为主发展。
(二)按出版类型划分
1.图书(Book)
凡篇幅达48页以上并构成一个书目单元的文献称为图书。
国际标准书号(ISBN)
2.连续性出版物连续出版物是指具有统一题名、定期或不定期以分册形式出版、有卷期或年月标识、计划无限期连续出版的文献。其主要特点是连续性、及时性和稳定性。它包括期刊、报纸、年度出版物及其他连续性报告、会议录、专著性丛刊等。在众多的连续性出版物中最具代表性的是期刊、报纸、年鉴。连续性出版物是与图书并列的最重要的文献类型。
(1)期刊(Journal Magazine periodical)
是指采用统一名称定期或不定期的连续性出版物。
具有连续的卷、期号或年、月顺序号。
ISSN (国际标准刊号)
核心期刊,是指某一学科中高水平、高影响力的期刊。
(2)报纸( Newspaper)
是指以刊载新闻和评论为主的连续性出版物,出版周期短(日、隔日、周报、旬报)有年、月、日顺序 。
(3)年度出版物(annual,yearbook)
汇集某领域年内重要资料,每年出版一次。它包括年报、年鉴及按年度出版、修订的百科全书等。
3.特种文献(special categories of documents)
(1)专利文献
(2)标准文献
(3)学位论文
(4)科技报告
(5)会议文献
(6)政府出版物
(7)产品资料
(8)档案
(三)按加工深度划分
1.零次文献指未经公开发表或未交流于社会的文献。如:私人笔记、设计草图、实验记录、论文草稿、会议记录、书信
2.一次文献一次文献也称原始文献,是指人们根据自己的科学实验、生产实践的成果而撰写的文献,一般指期刊论文、科技报告、会议论文、学位论文、专利等。
3.二次文献二次文献也称检索工具,是指对一次信息加工、整理后形成的各种检索工具,如目录、题录、文摘等,它不对一次信息提供评论,仅仅提供一次文献的检索线索,也就是说,二次文献是把一次文献从分散、无序的状态变成集中、有序化的状态,供人们迅速、准确地查询所需信息。
4.三次文献三次文献是指在利用大量一次文献的基础上,对其内容进行综合、分析、研究和述评而撰写出来的文献。分为综述研究类和参考工具类两种类型。前者如动态、综述、学科总结、专题述评等;后者如百科全书、年鉴、手册、科技词典、名录、手册等。三次文献源于一次文献,又高于一次文献,是一种再创性文献。
一次文献、二次文献、三次文献之间的关系:
从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走向有序、由一种有序结构演变为另一种完善的有序结构的过程。
四、网络信息资源迄今为止,对于“网络信息资源”尚没有统一的定义,类似的名称也很多,如“电子信息资源”(Electronic Information Resources)、“因特网信息资源”(Internet Information Resources)“联机信息”(On-line Information)、“万维网资源”(World Wild Web Resources)等。有关其定义也多种多样,如有人提出“电子信息资源是以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷纸质的载体中,并通过网络通信,计算机或终端等方式再现出来的信息资源”。网络信息资源,从字面上可以理解为“通过计算机网络可以利用的各种信息资源的总和”;从目的上看是“为了提高信息系统效率,实现资源共享而采用计算机网络整理、传递、获取的各种信息”;在范围上它不仅包括Internet上的信息资源,也包括各种局域网、城域网和广域网上的信息资源。
(一)按照网络信息的内容划分
1,网络数据库数据库亦称文献库、资料库,是发展最早、影响最广的一种主要电子信息源。脱离单机或专门的检索终端,与网络相结合,借助网络而提供服务的数据库即为网络数据库。网络数据库主要包括联机数据库和光盘数据库。
2,联机馆藏目录库图书馆作为信息的集散地,在网络的影响下纷纷向着数字化、网络化方向发展,为了使更多的读者充分利用图书馆资源并实现资源共享,众多图书馆建立了馆藏机读目录数据库并通过网络提供OPAC(Online Public Access Catalo)服务。
3,电子出版物网络上出现了越来越多的电子出版物,包括电子图书、电子期刊和电子报纸等。
4,政府机构信息政府机构以政府信息服务系统向公众提供信息。包括有关组织机构的宗旨、业务范围、人员、出版物、最新消息发布、各种法律、法规或相关政策信息等,内容相当广泛。
5,休闲娱乐信息这类资源较多,且大多免费提供给用户,包括各种新闻、广告、讨论组以及各种软件
(二)按照所采用网络信息的协议不同划分
1,基于超文本传输协议(HTTP)的信息资源万维网(World Wide Web,简称WWW或Web)信息资源是一种典型的基于HTTP的网络信息资源。Web建立在超文本、超媒体基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面(GUI)展现和提供信息的网络信息资源形式。由于其使用简单、功能强大,自20世纪90年代问世以来,成为发展最快、信息最丰富的一种网络信息资源形式。
2,基于文件传输协议(FTP)的信息资源
FTP协议的主要功能是完成从一个系统到另一个系统完整的文件复制,即在网络的联网计算机之间传输文件。通过FTP可以获得的信息资源类型很广泛。广义地说,任何以计算机方式存储的信息均可通过FTP协议获取,包括书籍、图像、声音、多媒体、一些书籍的电子版、电子期刊、某些政府机构发布的信息、大量的免费与共享软件等。
3,基于远程登录(Telnet)的信息资源这是指通过Telnet协议所访问到的网络信息资源。其实现方法为在远程计算机上登录,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问、使用远程计算机中对外开放的资源。这些资源包括硬件资源,如超级计算机,精密绘图仪,高速打印机,高档多媒体输入、输出设备等;也包括软件资源,如大型的计算机程序、图形处理程序以及大型数据库等信息资源。
第三节 我国文献信息的主要收藏及服务系统一、图书馆系统
1,公共图书馆系统
2,高校图书馆
3,科学研究系统图书馆二、国家科技信息系统三、专利文献系统四、标准文献系统五、档案系统第二章 信息检索技术与策略第一节 信息存储的基本知识信息存储是指利用一定的科学规则和方法,通过对信息的特征进行分析、表征和提炼,并按给定的参数和序列公式排列、存储在相应载体上,组织成系统化的具有检索功能的系统过程。
一、信息筛选信息筛选是对原始信息的挑选和鉴别,是建立信息资源检索系统的基础和保障。
信息筛选原则:针对性、系统性、预见性、科学性、计划性和及时性。
信息筛选方法:直观判断法、分析法、集体讨论法、专家裁决法、数学核算法、现场核实法等。
二、信息描述信息描述是指根据信息组织和检索的需要,依照一定的科学规则和技术标准,对信息的外部特征、物质形态和内容特征进行全面描述并给予记录的过程。
(一)信息外表特征的描述信息的外部特征是指信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征,它包含信息载体的物理形态、题名、加工者、出版或发表日期、流通或传播的标记等。
期刊论文的外表特征:文献的题目、著者、著者的工作单位、文献的出处(刊名、年卷期、起止页码)、语种、参考文献及图表的数量。
图书的外表特征:书名、著者(或编者、译者)、出版项(出版社、地点、时间)、稽核项(价格、页数、参考文献)、书号不同的检索系统(数据库)所描述的项目与标识符有所不同。
(二)内容特征的描述信息的内容特征就是信息包含的内容,它可以由分类号、主题词、关键词或其它知识单元来表达。
内容特征标引采用的方法主要有分类标引、主题标引。其中,分类标引是指对文献主题分析,用分类语言表达分析的主题,赋予文献分类检索标识(分类号)的过程;主题标引是指对文献进行主题分析,用主题语言(主题法)表达分析出的主题,赋予文献主题检索标识(主题词、叙词)的过程。
信息内容特征的标引较为复杂,必须借助于特定的信息检索语言。
三、信息检索语言信息检索语言是根据信息组织和信息检索的需要而创制的人工语言,又称信息组织语言、情报语言、标引语言、索引语言等。
(一)分类检索语言分类检索语言用分类号和类名来表达各种概念,将各种概念按学科门类的逻辑次序或事物的性质进行分类和系统排列。分类检索语言包括体系分类法和组配分类法。
1,体系分类法体系分类法是直接体现知识分类的等级制概念标识系统,它通过对概括文献信息内容及其某些外部特征的概念进行逻辑分类和系统排列而构成。
我国常见的体系分类法有《中国图书馆分类法》(简称中图法)、《中国科学院图书馆分类法》(简称科图法)、《中国人民大学图书馆分类法》(简称人大法);国外常见的体系分类法有《杜威十进分类法》(DC)、《国际十进分类法》(UDC)。
《中图法》是我国使用最为广泛的分类法,它分为5个基本部类、22个基本大类以及相应的二级类、三级类等。5个基本部类为:马克思主义、列宁主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书。采用英文字母与阿拉伯数字相结合的混合制号码,用一个字母表示一个大类,以字母的顺序反映大类序列,在字母后用数字表示大类下的类目划分。
体系分类法的主要特点是按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类角度检索文献信息的途径。
2,组配分类法组配分类法的原理是依据事物的性质,首先确定几个分类标准,即分面,再确定每个分类标准中的若干特征值,即类目,每一分面的类目与其他分面的类目分别组配,形成许多组配类目,达到细分的目的。
(二)主题检索语言主题检索语言是用语词作为概念标识,按字顺排列,并用参照系统等方法间接显示概念间相互关系的一种信息检索语言,也称主题法系统。
标题词语言(Heading) 受《词表》控制
单元词语言 (Uniterm) 受《词表》控制叙词语言( Descriptor ) 受《词表》控制关键词语言(Keyword) 无《词表》,不受《词表》控制
(三)主题检索语言与体系分类法的区别四 信息存储
1,数据库及其基础构成数据库(database)是“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”通俗地说,数据库就是在计算机存储设备上,按一定方式存储的相互关联的数据集合,是信息检索的基础。
一条信息记录(record)是由若干个款目所组成,每个款目称为一个字段(Field),字段是构成记录的基础;信息记录的集合就形成文档,一个数据库可以包含有一个文档,也可以含有若干个文档。文档也可以称为子数据库。
2,数据库记录的格式
“记录”(record)是数据库的基础成分,是对某一实体属性进行描述的结果,是组成文档的基本数据单位。每一条记录由三种类型的字段组成:检索系统存取号、基本索引字段和辅助索引字段。
举例:图书的记录格式
举例:期刊论文的记录格式
3,数据库的文档结构数据库的文档一般有顺排文档和倒排文档两种类型。
第二节 信息检索概述一、信息检索的发展历程及进展
(一)手工检索阶段
(二)机械检索阶段
(三)计算机检索阶段
1,脱机批处理检索
2,联机检索
3,光盘检索
4,网络检索二、信息检索的概念与原理信息检索(Information retrieval)是指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。信息检索是用户进行信息查询和获取的主要方式。
信息检索包括信息存储和信息检索两个部分信息检索流程图检索原理:检索提问标识与存储标引标识进行比较,两者一致或信息标引的标识包含着检索提问标识,则具有该标识的信息就从检索系统输出,输出的信息就是检索命中的信息。
三、信息检索的类型和方法
(一)信息检索类型
1,按检索内容划分
(1)文献检索:以文献线索为检索对象的检索。检索系统一般为书目、索引、文摘等二次文献。
(2)数据检索:以数值形式表示检索内容的信息检索。
(3)事实检索:以文献中抽取的事实为检索内容的信息检索。
(4)全文检索:以原始文献中所含的全部信息作为检索内容的信息检索,即是以文献全文作为检索内容的信息检索。检索的内容可以是全文,也可以是部分内容,并可进行各种频率的统计和内容分析,它通常用自然语言表达检索课题。
(5)图像检索:以有关人、事、物的形象,包括图像和图文信息为检索内容的信息检索。
(6)多媒体检索:多媒体检索通常是以文字、图像、数据和声音为检索内容的信息检索。
2,按信息检索手段划分
(1)手工信息检索
(2)计算机信息检索
(二)信息检索方法
1.工具法是指利用各种检索工具或数据库查找文献信息的方法。
(1)顺查法:以研究课题的起始年代为起点,由远及近,逐年查找,直至最近期为止。
(2)倒查法:针对研究课题,从最近期向早期回溯,直至查获适量切题文献信息为止。
(3)抽查法:抽查法是一种利用检索工具进行重点抽查检索的方法。
2.引文追溯法
利用文献所附的参考文献进行追溯查找。
3.循环法
是工具法与引文追溯法相结合的一种检索方法。
四、信息检索工具信息检索工具是用来存储、报道和检索文献线索的工具,具有存储和检索两个基本功能。
信息检索工具的类型按照不同的标准划分有不同的类型,最常用的一种划分方式就是按照著录内容划分,可以分为目录、题录、文摘三种。
第三节 现代信息检索策略一、分析检索课题,明确检索需求
1,分析课题学科属性、专业范围及相关内容
2,分析检索课题的信息类型和时间要求
3,明确用户自身的信息需求二、选择检索系统选择检索系统要考虑三方面的因素。一方面是检索课题的具体要求,包括所需要的学科、主题范围,对语种、年代、资源类型的要求,以及对查全、查准、查新方面的具体要求。另一方面,要考虑检索系统的类型和性能,包括其收录范围,报道内容及倾向、可获得性,存储年限、更新周期、所具有的检索功等方面。最后,要考虑检索者对检索系统的熟悉程度。综合上述几方面的考虑,选择匹配性最佳的检索系统。
三、确定检索途径
(一)以文献的外部特征为检索途径
1,题名途径
2,责任者途径
3,号码途径
(二)以文献信息的内容特征为检索途径
1.分类检索途径
2.主题检索途径四、选择检索词检索词是表达文献信息需求的基本元素,也是计算机检索系统中进行匹配的基本单元。选择检索词一般要考虑以下基本原则:
(1)所选检索工具有叙词表或主题词表的,优先选用叙词或主题词作为最基本的检索词;
(2)要从词表规定的专业范围出发,选用各学科内具有检索价值的基本名词术语;
(3)如选择的检索词无词表可查,或在词表中未反映,可选择自由词作为检索词;
(4)选词要适应待检数据库的检索用词规则;
(5)通常要选择常用的基本词汇进行匹配。
五、构造检索式
1.概念检索检索标识是具体的检索词或词组,每个检索词表达一个概念
2.布尔逻辑算符组配检索
是将多个检索词进行逻辑组配形成的一种复合性检索要求。
(1)逻辑与用符号,and” 或,*”表示,
其逻辑表达式为,A and B 或 A * B
其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。
(2)逻辑或用符号“or”或“+”表示,
其逻辑表达式为,A or B 或 A + B
其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。
(3)逻辑非用符号“not”或“–”表示,
其逻辑表达式为,A not B 或 A – B
其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。
3.位置逻辑算符
4.截词和屏蔽(模糊检索)
使用截词符(通配符):?,%,*,$
截词主要是利用检索词的词干或不完整的词形进行检索。
5.比较运算符
=等于,> 大于,< 小于,>= 大于等于,<= 小于等于
6.优先运算符
( ),‘……’,“……”
7.检索字段限定符
CNKI中国知网:专业检索某些外文数据库,TI=rice、AU=Li Hua
六、实施检索七、调整检索策略检索时,应及时分析检索结果是否与检索要求一致,如果不一致,则应对检索策略做相应的修改和调整,直至得到比较满意的结果。对检索结果的分析有如下三种情况:
1,检索结果信息量过多检索结果信息量过多的原因可能有:对所选的检索词的截词截得太短;未加字段限定或限定太过宽泛;使用了过多的相关词或上下位概念等。在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。
调整检索策略的方法如下:① 减少同义词与同族相关词。② 增加限制概念,采用逻辑“与”连接检索词。③ 使用字段限定,将检索词限定在某个或某些字段范围。④ 使用逻辑“非”算符,排除无关概念。⑤ 增加语种限制以及缩短检索期限。 调整位置算符,由松变严。⑦ 将截词的词根变长或减少截词算符的使用。
2,检索结果信息量过少
造成检索结果信息量少的原因有:选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;同义词、相关词、近义词没有运用全;上位概念或下位概念没有完整运用;字段限定太多;逻辑“与”、“非”用得过多;检索概念专指度过高等。这种情况要考虑扩大检索范围,提高检索结果的查全率。
调整检索策略的方法如下,① 选全同义词与相关词并用逻辑“或”将它们连接起来,增加网罗度。 ② 减少逻辑“与”和逻辑“非”的运算,丢掉一些次要的或者太专指的概念。 ③ 去除某些字段限制。④ 增加上位概念。⑤ 重新选择更合适的数据库。⑥ 调整位置算符,由严变松。⑦ 增加截词算符的使用。
3.检索结果中误检率过高错误率过高的原因可能有:检索词本身的多义性;主题词分析错误;使用了不规范的缩写。
调整检索策略的方法如下:① 对叙词进行相关的限定,如学科限定。② 提高用户分析课题的能力,确定核心检索词。③ 尽量少使用全文字段检索。④ 正确使用缩写词。
通过对检索策略的不断优化,从而使我们最终得到满意的检索结果。
八、获取原始文献获取全文的途径:首先是查找本单位购买的全文数据库;其次可利用那些提供流量计费下载的全文数据库网站获取;第三,向文献收藏单位联系馆际互借或文献传递;第四,可直接向作者索取;最后,都找不到的情况下,可向出版发行单位购买。
第四节 检索效果评价检索效果评价主要是指信息检索的最终结果是否满足用户需求或满足程度如何。
一、检索效果评价指标常用的评价指标有:查全率、查准率、漏检率、误检率、响应时间、用户负担和输出形式等,其中最常用的指标是查全率和查准率。
1,查全率(Recall ratio)与漏检率(Omission ratio)
查全率是用来描述系统检出相关文献能力的一种尺度,是指检索出的相关信息量与信息系统中的相关信息总量之比,其计算公式为:
查全率(R )=×100%
漏检率是指未被检出的相关信息量与信息系统中的相关信息总量之比,其计算公式为:
漏检率(O )=×100%
2,查准率(Precision ratio)与误检率(Fall-out ratio)
查准率是用来描述检索精确度的指标,是指检索出的相关信息量和检索出的信息总量之比,其计算公式为:
查准率(P )=×100%
误检率是指检索出的非相关信息量和检索出的信息总量之比,其计算公式为:
误检率(F )=×100%
二、影响检索效果的因素
(一)检索工具质量
存储文献是否齐全,索引系统是否完善,标引过程中失误率及标引深度(标引时分析文献所达到的深度),标引的全面程度等等,都对查全率和查准率有着很大的影响。
(二)标引语言与检索语言的一致性文献信息检索是将检索标识与文献标识进行匹配比较的过程。为了达到二者的匹配,检索者使用的语言必须与文献标引语言相一致,即必须使用检索工具中所采用的语言,否则,就达不到预期的效果,漏检率会增大。
(三)检索者的熟练程度文献信息检索专业性很强,检索人员必须熟悉相关专业知识,才能准确分析课题,制定合适的检索策略,获得良好的检索效果。因此,检索者应该熟悉检索工具和检索方法,了解检索工具的收录范围及提供的检索途径,以便灵活处理各种情况,提高检索效率。
(四)检索策略正确的检索策略及检索表达式可以优化检索过程,有助于提高查全率及查准率,取得最佳的检索效果。
用单个词检索时会有较高的查全率和较低的查准率;用几个单词进行组配检索时将会有较高的查准率,但查全率会下降。
在自然语言存在大量同义词与近义词、学名与俗称、新称与旧称、全称与简称、单数与复数这类词必须视为与检索词等同的词,才能保证查全率。自然语言中还存在大量的多义词,也会影响查准率。
三、提高检索效果的措施提高检索效果,一是要提高查全率和查准率,二是降低漏检率和误检率。针对上述影响因素,提出如下措施:
1.提高检索工具的编辑质量
2.准确使用检索语言
3.提高检索者的水平,制定最优检索策略
第三章 中文文献数据库检索第一节CNKI中国学术期刊网络出版总库一、简介
(一)CNKI(国家知识基础设施)工程简介提出:1998年世界银行提出全称/简称,国家知识基础设施(National Knowledge Infrastructure/ CNKI )
发起,由清华大学、清华同方发起始建,1999年6月
(二)重点数据库介绍(要求学生知道收录的数据库名称)
CNKI 系列源数据库:
中国期刊全文数据库(含世纪期刊)
中国博士学位论文全文数据库中国优秀硕士学位论文全文数据库中国重要报纸全文数据库中国重要会议论文全文数据库中国图书全文数据库二、中国期刊全文数据库
1.数据库简介期刊总数(8200 余种)、文献总量(2700 余万篇)、更新周期(中心网站日更新)、
全文质量(PDF全文数据格式)、时间范围(1994年----)、
学科范围(10个专辑168个专题3600个子栏目)、多种产品形式、……
检索主界面介绍
2.检索方式:文献检索、期刊导航(注具体的检索方式按当时数据库的最新检索方式进行介绍,以下所有数据库相同)
3.检索结果处理显示、标记、保存、打印、电邮全文(CAJ/PDF/TXT格式、打开/保存)
第二节 中文科技期刊数据库一、简介
1.维普信息资源系统简介维普信息资源系统是由重庆维普资讯有限公司研制开发的网络信息资源。
2.维普信息资源系统数据库:
《中文科技期刊数据库》(全文版)
《中文科技期刊数据库》(文摘版)
《中文科技期刊数据库》(引文版)
《外文科技期刊数据库》(文摘版)
《中国科技经济新闻数据库》
《中国企业及产品广告数据库》
3.中文科技期刊全文数据库简介期刊总数(8000 余种)、核心期刊(1810 种)、文献总量(2000 余万篇)、
更新周期(中心网站日更新)、全文质量(PDF全文数据格式)
时间范围(1989年至今)、学科范围(8个专辑28个专题)、检索方式(5种)
著录标准(中图法/检索期刊条目著录规则)、服务方式(5种)……
二、中文科技期刊全文数据库检索检索主界面介绍检索方式:快速、传统、高级、分类、期刊导航检索三、检索结果处理显示、标记、下载、打印、电邮、加入电子书架、我的数据库题录、文摘、全文(PDF格式/纯文本格式)
第三节 万方数据资源检索系统一、简介
1.万方数据股份有限公司万方数据股份有限公司是由中国科技信息研究所以万方数据(集团)公司为基础,联合山西漳泽电力股份有限公司、北京知金科技投资有限公司、四川省科技信息研究所和科技文献出版社发起组建的高新技术股份有限公司。
2.数据资源简介中国数字化期刊群、中国学术会议论文全文数据库(中文版)、中国学位论文全文数据库、中国标准全文数据库、科技信息子系统、商务信息子系统、外文文献数据库二、数据库检索
1.单库检索,
2.跨库检索:经典检索、专业检索三、检索结果处理显示、下载
第四节 人大复印报刊资料全文数据库检索一、数据库简介
简介、收录范围、收录时间、资源列表二、数据库检索数据库检索主界面检索方式:浏览检索、查询、高级查询、二次检索三、检索结果处理
显示:单篇显示、多篇显示
用户定制:标题定制、全文定制、排序、
检索历史、打印、保存全文全文格式:TXT格式
第五节 超星数字图书馆一、超星数字图书馆
1.简介超星数字图书馆由北京世纪超星信息技术发展有限责任公司投资兴建,2000年1月在互联网上正式开通。其内容包括文学、历史、法律、军事、经济、科学、医药、工程、建筑、交通、计算机和环保等几十个分馆,收录年限为1977年至今。
2.数据库检索
检索方式:快速检索、分类检索、高级检索
3.检索结果处理显示、阅读、下载、打印、收藏到我的图书馆二、读秀学术搜索
1.简介读秀学术搜索是由海量图书等文献资源组成的庞大的知识系统,是一个可以对文献资源及其全文内容进行深度检索,并且提供原文传送服务的平台。
2.检索方法
基本检索、高级检索
3.检索结果处理显示、阅读、文献传递
第六节 其他中文数据库一、书生之家数字图书馆二、方正阿帕比(Apabi)电子图书三、中国科学引文数据库四、中文社会科学引文数据库五、图书馆书目数据库
第四章 外文文献数据库检索第一节 世界三大农业数据库一、概述世界三大农业数据库是指CAB Abstracts、AGRIS、AGRICOLA
CABI是国际应用生物科学中心的缩写,其前身是CAB,即1928年成立的皇家农业局;CAB Abstracts是CABI出版的二次文献数据库(目前有部分全文),是世界上最大的农业文献数据库。
AGRIS数据库是由联合国粮农组织(FAO)所属的国际农业科技情报系统编辑的书目数据库。该数据库的学科范围包括农业、林业、畜牧业、渔业、食品科学、地球科学、环境科学、农业工程、人口、经济、法律、教育等。AGRICOLA数据库是由美国农业图书馆(NAL)、食品与营养信息中心(FNIC)、美国农业经济文献中心(AAEDC)等机构联合编辑的数据库。该数据库主题范围包括农、林、牧、水产、兽医、园艺、土壤等整个农业科学领域及动物、植物、微生物、昆虫、生态等生命基础科学及环境科学、食品科学。引用文献类型除期刊论文等连续出版物之外,还包括专著、学位论文、计算机软件、技术报告、专利、声像资料等。
二、检索方式简要介绍OVIDSP中数据库进入主页界面方法和主页界面。
OVIDSP检索相关检索技术(或技巧):布尔表达方式及应用、位置运算符应用方法、截词和通配符的应用等;字段限制检索的语法格式,常用字段缩写表达。
OvidSP的5种检索方法 (要求知道中英文名称)
三、OvidSP中检索结果处理的基本方法和步骤
第二节 EBSCOhost全文数据库
EBSCO Publishing 是美国的一家私人公司,创建于1948年,1986年开始发行电子产品,1994年开始在Internet 上提供在线服务。EBSCOhost是该公司推出的三大数据系统之一,也是目前世界上比较成熟的全文检索数据库之一,共包括60多个专项数据库,其中全文数据库10余个。
一、数据库概述(以ASP、BSP为例介绍)
ASP(Academic Search Premier)学术期刊数据库的简称,由EBSCO Publishing公司出版,是世界上最大的多学科学术数据库,提供近4700多种学术出版物的全文,包括3100多种同行评审期刊的全文。收录几乎覆盖学术研究的每个领域,并且所提供的内容信息最远可追溯至1975年。此数据库每日更新。
BSP(Business Source Premier)商业资源数据库的简称,由EBSCO Publishing公司出版,这是业界使用最多的商业研究数据库,提供 2300多种期刊的全文。与商业相关的所有主题范围几乎均包括在内。此数据库每日更新。
二、检索方法简要介绍该数据库进入主页界面方法和主页界面。
该数据库检索相关检索技术(或技巧):布尔表达方式及应用、位置运算符应用方法、截词和通配符的应用等;字段限制检索的语法格式,常用字段缩写表达。
检索方法(基本检索、高级检索、视觉搜索的中英文名称应该知道)的步骤及相关检索技术的灵活应用技巧。
第三节 ProQuest全文数据库
ProQuest是ProQuest Information and learning公司(原名UMI/Bell & Howell)推出的全文检索系统,为用户在网上进行多文档检索并随时获取全文提供了方便。该公司成立于1938年,是全球最大的文献信息服务公司之一,也是美国学术界著名的出版商。
该公司的信息遍及世界,其出版物收录了20000多种外文期刊、7000多种报纸、150多万篇硕、博士论文、20多万种绝版书及研究专集,内容覆盖1000多个学科和专业。目前我校图书馆购买的数据库主要有农业和生物科学两种。
检索技术(或技巧):布尔表达方式及应用、位置运算符应用方法、截词和通配符的应用、双引号表达意义等检索方法:基本检索、高级检索、主题和出版物检索(中英文名称应该知道)
第四节 ScienceDirect电子期刊全文数据库
ScienceDirect是Elsevier Science公司的核心产品。Elsevier Science是一家总部设在荷兰的历史悠久的跨国科学出版公司,所出版的期刊是世界上公认的高品位学术期刊,且大多数为核心期刊,被世界上许多著名的二次文献数据库所收录,其中60%以上的期刊被SCI收录。
第五节 其它外文数据库一、Web of Science
二、Cell Press Journals
三、SpringerLink
四、Wiley InterScience
五、MEDLINE
六、EMBASE.com
七、Engineering Village 2
八、SciFinder Scholar
九、BIOSIS Previews
十、Food Science and Technology Abstract
十一、LexisNexis Academic学术大全数据库十二、NetLibrary电子图书十三、Dialog国际联机检索系统
第五章 特种文献检索第一节 专利文献及其检索一、专利概述
1.专利的概念
“专利”一词从不同的角度,具有三种含义:
(1)专利就是专利权的简称,是指从法律角度所认定的权利。
(2)专利是指取得专利权并受到专利权保护的发明创造,是从专利权客体的角度来阐述专利的含义。
(3)专利是指专利文献。从专利公开的形式来说,专利是指记载享有专利权的发明创造内容的专利文献。通常说的“查专利”就是指查专利文献。
2.专利权的特征独占性、地域性、时间性
3.专利的类型
(1)发明专利(保护期限20年):是指对产品、方法或者其改进所提出的新的技术方案。因此,发明专利分为产品发明、方法发明和用途发明。发明专利是三种专利中最重要的一种。
(2)实用新型专利(保护期限10年):是指对产品(包括机器、设备、用具等有形物)的形状、构造或其组合所提出的适于实用的新技术方案。这种新的技术方案能够在工业上制造出具有使用价值和实用用途的产品。由于实用新型专利的创造水平低于发明专利,人们常称之为“小发明”或“小专利”。
(3)外观设计专利(保护期限10年):外观设计亦称为工业品外观设计,是指对产品的形状、图案或者其结合以及色彩与形状、图案的结合所作出的富有美感并适于工业应用的新设计。
4.获得专利权的条件
(1)新颖性新颖性是发明和实用新型能否获得专利权的首要条件。我国《专利法》第二十二条对新颖性定义为:新颖性是在申请之日以前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其它方式为公众所知,也没有同样的发明或者实用新型由他人向专利局提出过申请记载在申请日以后公布的专利申请文件中。
(2)创造性创造性是发明和实用新型取得专利权的另一个实质性条件。创造性是指与申请前已有的技术相比,该发明或者实用新型有突出的实质性特点和显著的进步。
(3)实用性实用性是指该发明或实用新型能够制造或者使用,并且能够产生积极效果。
5,专利制度的作用
(1)保护与鼓励发明创造
(2)有利于新技术的交流与传播
(3)鼓励与促进新技术的开发及应用
(4)有利于鼓励、吸引国外投资二、专利文献概述
1,专利文献的概念专利文献是指各国专利局(知识产权局)及国际专利组织在受理审批专利过程中产生的官方文件及其出版物的总称。作为公开出版物的专利文献主要有:专利说明书、专利公报、专利索引等。狭义的专利文献仅指专利说明书。
2.专利文献的特点新颖性、广泛性、规范性、快速性、重复性三、国际专利分类表(IPC)
1,IPC是欧洲理事会编制的专利分类表,是类分专利文献和通过主题来检索专利文献的重要工具。
2,IPC1968年9月1日第一版IPC生效,每5年修订一次。
3,IPC采取功能分类和应用分类结合、以功能分类优先的原则,并采用等级分类体系,将技术内容按部、分部、大类、小类、主组、分组逐级分类,组成一个完整的分类系统。
IPC共分8个部,20个分部,100多个大类,600多个小类,5.8万多个主组与分组。部的类号用大写字母A—H表示,分部无类号标识。
四、中国专利文献检索
1.专利公报中国专利公报是中国专利局的官方出版物,专门公布和公告与专利申请、审查、授权有关的事项和决定,是检索中国专利文献的主要检索工具。专利公报分为“发明专利公报”、“实用新型专利公报”、“外观设计专利公报”三种,均于1985年创刊,周刊,采用摘要的形式报道,附有专利公报索引和年度索引。1992年8月起,上述三种专利公报均被收入“中国专利文献数据库”。
2.专利索引
《中国专利索引》自1986年以来由中国专利出版社逐年出版,收集了1985年4月1日我国专利法实施以来在三种专利公报上公布的所有中国专利信息条目,该索引为题录型检索工具,1986-1992年间每年出版一次,从1993年起,每半年出版一次,每次出版分两个分册,第一分册为分类年度索引,按国际专利分类表或国际外观设计分类号顺序排列;第二分册为申请人、专利权人年度索引,按申请人、专利权人名称的汉语拼音顺序排列。
《中国专利索引》和《专利公报》可单独使用,也可配合使用。
3.中国专利文献数据库五、国外专利文献检索
1.德温特出版公司《世界专利索引》(World Patent Index,简称WPI)
2.网上专利信息检索
Internet上有丰富的专利文献信息源,除了DIALOG、STN等著名的联机网络检索系统提供的专利文献服务外,还有许多其他可获取专利文献信息的网站。
第二节 标准文献及其检索一、标准文献概述
1.标准的概念标准就其具体涉及的范围而言,主要是指对工农业产品和工程建设的质量、规格及其检验方法等所作出的技术规定。
2.标准文献的概念标准文献主要是指与技术标准、生产组织标准和管理标准相关的文献,也包括国家颁布的环境保护法、森林法、消费品安全保障法、药典、政府标准化管理机构的有关文件以及与标准化工作相关的其他文献。标准文献的主体是标准。
标准文献除了以标准命名外,还常以规范、规程、建议等名称出现。国外标准文献常以Standard(标准),Specification(规格、规范),Rules、Instruction(规则),Practice(工艺),Bulletin(公报)等命名。
3.标准文献的类型
(1)按标准的使用范围划分:国际标准、区域标准、国家标准、行业标准、地方标准、企业标准
(2)按照标准的性质划分:技术标准、工作标准、管理标准
(3)按照标准的成熟程度划分:法定标准、推荐标准、试行标准二、中国标准文献检索
1.印刷型检索工具:《中国国家标准汇编》、《中国标准化年鉴》、《世界标准信息》、《中华人民共和国国家标准目录及信息汇总》
2.主要网站:中国标准服务网、中国标准化信息网、中国国家标准咨询服务网、国家标准化管理委员会三、国际标准及其检索
1.国际标准:
国际标准主要是指国际标准化组织的标准(ISO标准)和国际电工委员会的标准(IEC标准)和国际电信联盟的标准(ITU标准),此外还包括国际标准组织认可的其他27个国际组织制定的标准。
2.国际三大标准组织
(1)国际标准化组织(简称ISO)
(2)国际电工委员会(简称IEC)
(3)国际电信联盟(简称ITU)
3.国际标准文献检索的主要数据库及网站美国IHS标准数据库、ISO网站、IEC网站、美国国家标准学会
第三节 会议文献及其检索一、会议文献概述会议文献是指在各种会议上宣读提交的论文、产生的记录及发言、论述、总结等形式的文献。许多学科中的新发现、新进展、新成就以及提出的新研究课题和新设想,都是以会议论文的形式向公众首次发布的。会议文献具有以下特点:内容新颖、及时性强;学术水平高、专业性强;数量庞大,内容丰富;可靠性强;出版形式多种多样。
二、会议文献检索
第四节 学位论文及其检索一、学位论文概念学位论文是高校和研究机构的本科生、研究生为获取学位资格而撰写的学术论文。
二、学位论文检索
第五节 科技报告及其检索一、概念科技报告是指科研工作成果的正式报告或研究过程进展情况的技术文献。
二、科技报告的分类三、科技报告的检索
第六章 Internet网络信息资源检索第一节 Internet基础知识一、Internet的起源与发展纵观Internet的发展历史,它经历了如下三个发展阶段:
1,ARPAnet的诞生
2,NSFnet的出现
3.现代Internet的产生二、Internet在中国中国的四大骨干互联网
(1)中国科学技术网(CSTNet)
(2)中国金桥信息网(ChinaGBN)
(3)中国公用计算机互联网(CHINANET)
(4)中国教育和科研计算机网(CERNET)
三、Internet的基本概念
1,TCP/IP协议
(1)TCP/IP协议的作用:是Internet保证各种不同类型的计算机网络实现相互通信一套规则或协议。
(2)TCP协议的概念和用途:TCP是传输控制协议,规定传输信息怎样分层、分组和在线路上传输。
(3)IP协议的概念和用途:是网际协议,定义Internet上计算机之间的路由选择,把不同网络的物理地址转换为Internet地址。
2,IP地址和域名
(1)IP地址的概念:Internet上的众多计算机和信息资源必须通过名字和地址来进行识别,接入Internet的计算机或节点被赋予一个惟一的数字作为地址,称为IP地址,用小数点隔开的四组数字组成。
(2)域名的概念和结构:Internet中每台计算机的域名结构为主机名、机构名、网络名、最高层域名。
3,URL(统一资源定位器)
URL是信息在网上的地址,可以将世界上所有的联机信息资源组织成有序结构,用来定位和检索WWW上的文档。它的格式有三部分组成:第一部分是协议(或称服务方式),大部分Internet文档用http,其他常用的协议有ftp、nntp、gopher、telnet等;第二部分是存有该资源的主机IP地址;第三部分是主机资源的具体地址。
四、Internet提供的信息服务
1,WWW信息服务
2,远程登录(Telnet)
3,文件传输协议(FTP)
4,电子邮件(E-Mail)
5,网络新闻服务(Network News)
6,Gopher信息服务
7,博客(Blog)与RSS
第二节 网络检索工具一、网络检索工具的组成网络检索工具由三个部分组成:数据采集子系统、数据组织子系统和用户检索子系统。
二、网络检索工具的类型
1,按检索机制划分根据检索工具的数据检索机制,可将检索工具分为检索型、目录型和混合型三种类型。
2,按检索内容划分根据检索工具的数据内容,一般可将检索工具分为综合型、专题型和特殊型三种。
3,按包含的检索工具数量划分根据检索工具数量划分为单独型的检索工具和集合型的检索工具。
4,按检索资源类型划分根据检索工具针对的数据资源类型,可分为万维网检索工具和非万维网检索工具。
第二节 常用搜索引擎及专业网站搜索引擎:广义上是指一种基于Internet上的查询系统,包括信息存取、信息管理和信息检索;狭义上是指一种为搜索Internet上的网页而设计的检索软件。
一、中文搜索引擎
(一)Google中文版
1,简单搜索关键词搜索技巧:
(1)不支持截词,但可以在搜索时使用通配符*,而且包含“*”必须用""引起来,这在搜索诗词时特别有效。如:“床前明**”
(2)对大小写不敏感。
(3)最常用的字符以及数字和单个字母等高频词,在检索时系统自动忽略不作检索,称为禁用词,如果必须检索禁用词时可用,”。如:“www”
(4)支持布尔逻辑运算,逻辑与检索无需添加and,两词间空格默认and匹配;逻辑或检索必须用大写OR连接关键词;逻辑非检索用-表示,但减号之前必须留一空格,不能使用not表示。
(5)短语或词组检索可用“”限制短语或词组的完整性。
(6)“~”符号搜索近(同)义词。如:输入~management,结果中不仅包括management,还包括“manager”、“administration”等词的页面。
(7)拼音汉字转换。Google 运用智能软件系统对拼音关键词能进行自动中文转换并提供相应提示。例如:搜索“shang wu tong”,Google 能自动提示,您是不是要找:商务通”。 并能支持模糊拼音搜索,为用户提示最符合的中文关键词。
(8)一些算符的使用:define、link、filetype、inanchor、intext、intitle、inurl、site、related
2.高级搜索
3.模块搜索
4.帮助工具手气不错、使用偏好、网页翻译、语言工具、网页快照、类似网页
(二)百度
1.简单搜索关键词搜索技巧:
(1)对大小写敏感。当以大写字母查询时,默认为精确匹配,即查询结果不包括小写的关键词;而以小写字母查询时,则同时查找大写和小写。
(2)最常用的字符以及数字和单个字母等高频词,在检索时系统自动忽略不作检索,称为禁用词,如果必须检索禁用词时可用,,。
(3)支持布尔逻辑运算,逻辑与检索无需添加and,两词间空格默认and匹配;逻辑或检索用 | 连接关键词;逻辑非检索用-表示,但减号之前必须留一空格。
(4)短语或词组检索可用“”限制短语或词组的完整性。
(5)书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,而在百度,中文书名号是可被查询的。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。
(6)支持算符的应用,如:filetype、intitle、inurl、site。
2.高级搜索
3.模块搜索
4.百度帮助
(三)中国雅虎
(四)搜弧二、英文搜索引擎
(一)AltaVista
AltaVista是功能全面、搜索精度较高的全文搜索引擎之一。截止2002年6月,AltaVista宣称其数据库已存有11亿个Web文件,并且经过升级,其搜索精度已达业界领先水平。允许以25种不同的语言进行搜索,并提供英、法、德、意、葡萄牙、西班牙语双向翻译。
(二)Excite
Excite是一个基于概念性的搜索引擎,它在搜索时不只搜索用户输入的关键字,还可“智能性”地推断用户要查找的相关内容进行搜索。它建立了一个收集有5500万网页的新闻组数据库,还每天搜索300个新闻媒体,将有关内容组织到新闻文章索引数据库。
(三)Lycos
Lycos创建于1995年,是搜索引擎的元老,最早提供信息搜索服务的网站之一。Lycos提供有18大类目录总共超过25万个网站查询,并且每周添加并更新内容,同时提供了网站、网页、新闻、小说全文阅读、产品、FTP、MP3、多媒体(图片,音频和视频文件)等多功能的搜寻服务。
三、常用农业生物专业网站
1,美国国家农业图书馆(NAL)
2,联合国粮农组织(FAO)
3,国际应用生物科学中心(CAB International)
4,欧洲农业网
5,欧洲生物信息研究所(EBI)
6,美国国家生物技术信息中心(NCBI)
8,PSD数据库
9,中国农业信息网
10,中国农业科技信息网
第四节 开放存取信息资源的利用什么是开放存取?
《布达佩斯开放获取计划》(BOAI)中给出的“开放存取”的定义:对文献的“开放存取”不应存在不同的政策和权限,用户可以通过Internet免费阅读、下载、复制、传播、打印和检索作品,实现对作品全文的链接,为作品建立索引,将作品作为数据传递给相应软件,或者进行任何其他出于合法目的的使用。而这些使用方式除网络本身的物理障碍和出于对作者著作权保护的考虑外,不应受经济、法律和技术的任何限制。
第五节 学科信息门户网站资源利用一、学科信息门户的概念学科信息门户(Subject Information Gateway,SIG)是一种专业性网站,为研究人员、教师和研究生提供高质量的、经过筛选和定期更新的学科信息目录和入口。图书馆员和学科专家对互联网上同一个学科有关的资料(期刊、图书、数据库和软件等)进行系统的整理和规范加工,形成可供用户检索和浏览的目录数据库,为科研和教学提供权威可靠的网络信息导航服务。
二、国内代表性的学科信息门户网站
1,中国科学院国家科学图书馆学科门户网站(http://www.csdl.ac.cn/)
2,国家科技图书文献中心热点门户(http://www.nstl.gov.cn/index.html)
第七章 信息资源的综合利用第一节 文献信息资源的搜集与整理一、搜集原则与方法
1.搜集原则及时性原则、系统性原则、针对性原则、计划性原则
2,信息搜集常用方法系统文献检索、跟踪最新信息二、文献信息的整理与组织
(一)文献信息的鉴别
1,可靠性
2,新颖性
3,适用性
(二)文献信息的整理
1,分类整理
2,主题整理
3,名称整理
4,号码整理
5,时间整理
6,地区整理三、文献信息的阅读策略
1.先读文摘,后读原文
2.先粗读,后精读
3.先读综述性文献,后读专题
4.先读现刊,后读过刊
5.优先阅读核心期刊、专业期刊四、文献信息的分析
第二节 学术论文写作
科技论文的结构科技论文的主要结构要素包括前置、主体和附属三个部分。题名、作者、摘要和关键词为前置部分,引言、正文和结论、参考文献为主体部分,附录为附属部分。
第三节 个人信息管理工具随着信息资源日益丰富和需求不断提升,用户迫切需要一个既能方便使用和管理,又可满足多种功能要求的管理工具来统筹管理各种文件和资料。能够实现这些功能并能起到事半功倍效果的软件,我们称之为个人信息管理工具。目前,用于个人信息管理的软件有很多,国外常见的有EndNote、Reference Manager、ProCite以及基于网络的Refworks等,国内常见的有NoteExpress、文献之星、医学文献王、PowerRef等。
课程总结