课程介绍
,网络信息开发与利用,基于因特网,针对检索与获取对大学生研究、开发、学习对网络信息的需求,系统地介绍因特网信息资源的特点、种类、信息利用价值 及评价、鉴选标准; 介绍因特网信息检索的基础知识、
各类型常用因特网信息检索工具的功能、特点和使用及检索方法 ; 详细介绍学术性研究信息,公共信息及 各类专门信息的网上检索平台及查找方法。 教学的目的在于 在培养学生的信息素质,培养大学生网络信息检索与利用能力,
提高大学生网络环境下的生存和发展水平。 在培养学生的信息素质。但因课时的限制,课堂讲述重点是检索技能及重要信息资源的利用,不求全面但求实用。
第一章 信息资源和信息素养教育第一节 信息的意义一,信息的基本含义二,信息资源及类型三,信息素质与综合素质四,信息素质与创新能力五,信息利用与事业进步第二节 高校图书馆信息资源的利用第一节 信息的意义
一、信息的基本含义
信息一词久存于人类社会和人们的日常生活之中,但作为科学术语,不同的学科从不同的层次、不同的角度给予了不同的描述,关于信息的定义有 100多种,这是由于信息本身的复杂性和人们对其认识的不确定性使之处于多定义并存的状态。比较有代表性的有哲学、经济学、控制论、新闻学、心理学、图书情报学、信息资源管理学等领域对它的描述。 在这里,我们所指的信息,是经过采集、处理、记录并以可检索的形式存储的数据,属于信息资源管理学范畴对信息的描述。
二、信息资源及类型
1,信息资源的概念
20世纪 60年代,斯蒂格勒研究了信息在经济活动中的作用机制,发现信息可以减少经济活动中的不确定性,降低投资和生产成本,产生经济效益 。 随后,
马克卢普,波拉特,贝尔等经济学家提出了信息经济的理论,认为信息是后工业社会的改造资源,由此产生信息资源的概念 。
信息资源是 一个宽泛的概念,可以从二个方面来理解和把握:
广义的信息资源指人类社会活动中累积的信息、信息生产者、信息技术等要素的集合。
它包括四层含义,一为人类活动中产生并经过加工整理的有效信息;二为有效信息的生产者;
三为信息加工传递技术;四为支持信息活动的其它元素,如经费、设施设备等。
狭义的信息资源指广义信息资源的第一层次,即 人类活动中产生并加工的有效信息,或者说是文献学意义上的信息资源,即一定载体上的文献、数据或多媒体信息内容。
2、信息资源的类型
按加工程度分为 一次信息资源、
二次信息资源、三次信息资源 ;
按开发程度分为潜在的信息资源、
现实的信息资源;
按载体和存贮方式分为天然型信息资源、实物型信息资源,纸质型信息资源、非纸质型信息资源。
三、信息素质与综合素质
1,信息素质的含义
2,信息素质的内容
3,信息素质与综合素质的关系
1、信息素质的含义关于信息素质的研究是从 20世纪 70年代开始的,
对信息素质的认识经历了一个渐进的过程,信息素质可以概括为个体在现实需求的驱动下,能有效地发现,获取,评价和利用信息 。 它包含四个层面的含义,第一,用户有一定的信息需求,即在某个时候需要了解某方面信息 。 第二,掌握了主要的信息源和信息工具的知识及技能 。 第三,
能够分析评价选择相关信息 。 第四,利用信息的目的是为了有效地解决具体问题 。 信息素质主要表现为信息理论素养和信息的实践能力,包括 信息意识,信息知识,信息能力 和 信息道德 等内容 。
2、信息素质的内容
信息意识
信息知识
信息能力
信息道德信息意识同样重要的信息,有的人善于抓住,有的人却漠然视之。这是由于各人的信息意识强弱不同。信息技能的掌握在很大程度上取决于信息意识的提高。
所谓信息意识,简单地说,是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。
有无信息意识决定着人们捕捉、判断和利用信息的自觉程度。而信息意识的强烈与否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。
信息意识含有信息认知、信息情感和信息行为倾向三个层面。信息认知是指对信息和信息活动的了解和看法,其中最重要的是评价性的认知;信息情感是指人们多次从多方面感受信息的过程中,逐渐形成的某种持久、
稳定的、反映本质的需求关系的内心体验,这种体验相对持久、相对稳定,而不是那种即时产生的情绪;信息行为倾向是指个人在信息活动中欲表现出来的行为趋向,
是信息行为的心理准备状态。
信息意识形式有两种:一是被动接受状态,二是自觉活跃状态。前者指人们从社会的信息环境中被动地接受事先未料及的信息;后者指信息意识的觉醒状态,它促使人们制订信息活动计划,主动关心和了解各种变化,
并作出相应的选择。
人们的信息搜集活动是受信息需求驱使的,影响需求的力量的大小主要就是需求被意识的清晰程度 ——意识越明确,
行动目标越清楚,则信息活动的动机越稳定、持久、强烈,
努力程度也就越高。因此,信息意识的强弱直接影响人们的信息需求程度。
作为大学生,应具有这样一种信息意识:认识到信息和信息活动的功能和作用,认识到信息对他们的学习和课余科研活动的效用,认识各种信息源的价值和信息机构提供的产品和服务,形成对信息的积极体验,进而产生与学习和课余科研相适应的信息需求和信息行为倾向。经常注意并搜集各种载体的信息,积极利用包括图书馆在内的各种信息机构的服务,努力扩充知识面,主动地、有意识地去学习基本信息检索技能。
信息意识的有无和强弱可从以下几方面进行判断:
是否认识到信息和信息活动的功能和作用。
是否具有对信息和信息活动的积极体验 (依赖感、
赞同感和支持感 )。
是否具有与学习有关的信息需求和信息行为倾向,愿以最少的时间高效率地了解、查询自己需要的信息。
是否能自觉地表达出情报需要,并能及时地去查寻或主动利用信息系统来满足这种需求。
是否善于运用创造性思维,从大量信息中捕捉新动向,猎取趋势性的或有价值的信息。
信息知识是关于信息的特点,性质,运动规律,信息方法与技术,信息系统的有关知识 。 其中信息方法是指如何以信息的观点来分析和解决人们在工作和生活中遇到的问题的方法,把无序而良莠不齐的信息转化为有效信息加以利用,创造出新的价值 。 信息技术是关于信息提取,检测,处理,转换,传递,控制等技术,如计算机技术,数据库技术,通信技术,网络技术等 。
信息能力是人们 获取信息,分析信息,加工信息,传递信息,创造信息等能力的综合,是信息素质的核心部分和主要内容,包括信息查询与获取能力,
信息交流与传播能力,信息组织与整合能力,信息利用能力,信息评价能力等,是提高信息素质的关键所在 。
寻求有关新知识的能力就是我们今天所说的信息技能。在大学期间,它又具体表现为以下 6种技能:
明确任务,了解问题的症结,确定所需信息和目的,分清任务的轻重缓急;
信息查询策略,了解各种信息源,能够作出评价并确定优先查找的次序;
查找和检索,确定信息藏址,从信息源中找出信息;
信息利用,能够读懂 (或听懂、理解 )查出的信息,了解信息在满足需求中的特定价值;
信息综合,能够组织信息,提供信息产品 (论文、报告等 );
信息评价,评价查找结果和解决问题的过程 (效率 )。
信息道德是指在信息活动中调节和控制信息生产者、
信息服务者、信息利用者及其相互关系、伦理道德和行为规范的总和。具体有遵守国家有关信息的法律法规、不制作不传播不利用违反国家政策的信息和不健康信息、不制作不传播虚假信息、
不侵犯知识产权、不利用信息技术谋取不正当利益和从事违法活动等。在日趋繁杂的信息环境中,
自觉而良好的信息道德,是信息素质中不可忽略的一部分。
在信息素质四个方面的内容中,信息意识是前提,信息知识是基础,信息能力是核心,信息道德是准则,它们的有机结合构成信息素质整体。
3、信息素质与综合素质的关系信息素质是综合素质的重要组成因素,二者相辅相成,良好的信息素质可以极大地提高综合素质,
而良好的综合素质也直接影响信息素质的提高。
四、信息素质与创新能力没有知识就不能创新这是大家的共识。而人们的知识一方面来自自己对客观世界的观察与认识,
另一方面则来自对其他个体(包括前人)的吸收与继承。人们的知识创新与技术创新需要大量的有关信息。今天的世界并不缺乏创新所需的信息,而在于知识的存贮过于庞大和无序,信息存贮的无序化以及过多的老化信息和伪信息加剧了“信息污染”
的程度。今天的社会 没有良好的信息素质是很难全面、系统、及时地掌握创新所需的信息的。可以这样的认为,信息素质是创新能力的重要因素,良好的创新能力依赖于优秀的信息素质 。
五、信息利用与事业进步信息是生命、是财富、是力量、是事业核心竞争力的重要组成因素。
重视信息类课程学习、切实提高自身信息素养
1、信息素质教育类课程与计算机类课程区别
2、利用 Internet与信息素养
3、信息素质教育类课程的内容第三节 高校图书馆信息资源的利用一、图书馆对大学生的意义
1、学习的阶段性特点决定了大学生的信息需求
2、个人信息购买能力问题
3、良好学习的环境
4、图书馆对用户提供的各种教育二、图书馆基本介绍
1、高校图书馆
2、公共图书馆
3、研究所图书馆
4、其他三、高校图书馆的基本布局
主要服务部门及主要服务:
信息咨询部:主要承担用户教育、定题服务、成果查新、情报调研和各种信息咨询等
图书借阅部:主要承担图书的借阅服务。
期刊部:主要提供期刊阅览服务。
电子阅览。提供电子信息阅览服务。
行政管理部门:用户信息交流和解决各部门上交的问题。
四、高校馆信息的基本组织与分区
1。文种:中文、日文、俄文、西文,其他
2。 学科:社会科学( A——K类)
人文科学( A,B,C,D,I,J,K等类)
自然科学( N——X类) Z:综合类
3。信息内容的基本类目
A 马克思主义、列宁主义、毛泽东思想,邓小平理论
B 哲学、宗教
B80 思维科学,B81 逻辑学(论理学)
B83 美学,B84 心理学
C 社会科学总论
C0 社会科学理论与方法,C8 统计学,C91 社会学
C93 管理学,[C94]系统科学,C96 人才学
D 政治、法律
D9 法律
E 军事
F 经济
G 文化、科学、教育、体育
G2 信息与知识传播
G3 科学、科学研究
G4 教育
H 语言、文字
H1 汉语,H2 中国少数民族语言
H3 常用外国语,H31 英语
I 文学
J 艺术
K 历史、地理
K81 传记
K85 文物考古
K89 风俗习惯
K9 地理
N 自然科学总论
N0 自然科学理论与方法论
N3 自然科学研究方法
N93 非线性科学
N94 系统科学
[N99]情报学、情报工作
O 数理科学和化学
O1 数学
O4 物理学
O6 化学
P 天文学、地球科学
P4 大气科(气象学 )
Q 生物科学
Q1 普通生物学
Q2 细胞生物学
Q3 遗传学
Q4 生理学
Q5 生物化学
Q6 生物物理学
Q7 分子生物学
Q81生物工程学(生物技术)
[Q89] 环境生物学
Q93 微生物学
Q94 植物学
Q95 动物学
Q96 昆虫学
R 医药、卫生
S 农业科学
S1 农业基础科学
S2 农业工程
S3 农学(农艺学)
S4 植物保护
S5 农作物
S6 园艺
S7 林业
S8 畜牧、动物医学、狩猎、蚕、蜂
S9 水产、渔业
T 工业技术
TM 电工技术
TN 无线电电子学、电信技术
TP 自动化技术、计算机技术
TP3 计算机技术、计算技术
TQ 化学工业
TS 轻工业、手工业
TS2 食品工业
TS97 生活服务技术
TU 建筑科学
TV 水利工程
X 环境科学、安全科学
Z 综合性文献
4、信息载体的排架规律五、图书馆信息利用中应注意的问题
1。不同类型文献信息的特点及用途
一次文献:期刊论文、报纸信息、学位论文、会议信息、专利文献、标准文献、科技报告、政府出版物、档案材料等
二次文献:各种检索工具
三次文献:图书、参考工具书
2。各类信息的利用方法
3。遵守规章制度,维护学习环境。
第二章 信息检索的基础知识信息检索,是根据特定的需求,运用检索工具,按照一定的方法,去寻找资料或信息的工作过程,这种方法利用的是序化的信息系统和信息业提供的服务来满足自己的信息需求。本章将介绍网络检索的基本知识,让读者了解检索的一般程序,包括如何分析问题、如何获取原文、何谓检索语言、了解电子信息源的检索与利用方法。
第一节 信息需求类型及特点信息需求可以简单地理解为人们为了了解某类事物的属性以达到某种特定目的,由此而产生的了解相关信息的一种需要。因为目的不同,信息需求不同,而导致检索行为的不同。
一、文献信息需求文献信息需求以获得一定的文献原文来满足人们的信息需要。这种需求需要利用提供原始文献或提供原始文献线索的检索工具。
1、写论文需要的文献信息主要是要求能给论文帮助的 新的、有代表性的文献信息 。检索上不求全。
2、科学研究需要的文献信息要求能全面、系统地掌握 某一阶段内相关的全部文献信息 。检索上允许一定的误检,
不允许漏检 。
3、解决某种具体问题需要的文献信息要求文献种能提供 相同或相似情况下的解决方法 。检索上强调准确性,只求对解决问题的帮助,没有量上的要求。
二、非文献信息需求非文献信息需求以获得一定的有关事实或数据来服务人们。
这种检索通常利用能直接提供事实或数据的工具来检索。
第二节 文献基本知识
1,文献的涵义,文献是,记录有人类精神信息的、
且便于存贮或传递的人工固态附载物,。
2、文献的构成现代文献由四要素构成,文献信息、文献载体,
符号系统和记录方式 。文献信息是文献的内容,符号系统是信息的携带者,载体是符号赖以依附的
,寄主,,而记录方式则是代表文献的符号进入载体的方法和过程,四要素缺乏任何一种都不可能形成文献。
☆ 文献的符号系统文献中的 符号系统 指图画、文字、公式、图表、
编码,声像和电磁信息等
☆文献载体及其形态文献载体的材质在人类文明的演进过程中一直在不断地 演变 。目前,除了纸质文献外,常见的其他介质的文献主要有以下类型,缩微文献,音像文献,
磁盘和光盘文献 。
3。按文献生产加工层次划分的文献形式从对文献的生产加工层次来看,文献又可以分成 一次文献、二次文献和三次文献 。
专著、报纸、期刊、专利文献,标准文献,会议文献,样本等成品文献属于一次文献 ( Primary literature),即人们对自然和社会信息进行首次加工 (固化 )而成的文字记载,这是文献信息源的主要部分,
数量极为庞大,由于在内容上是分散的、
无系统的,因此不便于管理和传播。
为了控制文献,便于人们查找,对一次文献进行再加工,通过整理、提炼和压缩,并按其外部特征 (题名、作者、文献物理特征 )和内容特征序化,形成另一类新的文献形式 ——目录、
书目、索引、文摘,这 就是二次文献
(Secondary literature)。二次文献不是一次文献本身的汇集,而是一次文献特征的汇集,
通过它们可以很方便地找到一次文献,或了解一次文献的内容。
利用二次文献,选择有关的一次文献再加以分析、综合而编写出来的第三个层次的文献形式 ——专题报告、综述、进展 以及手册,百科全书、年鉴等 工具书,这就是三次文献 (Tertiary literature)。 三次文献具有系统性、综合性、知识性和概括性的特点,它从一次文献中汲取重要内容提供给人们,便于他们高效率地了解某一领域的状况、动态、发展趋势和有关情况。
第三节 检索的一般程序检索过程通常要考虑以下四个主要步骤:
1.分析问题,目的是正确地选用检索工具和确定检索策略
2.选择检索工具要知道哪类问题该用哪类工具书解决,还要熟悉一些具体工具书的内容、范围、特点、编排结构;工具之间的相互关系,包括内容和时间的联系。
3.从检索工具中查找所需信息
4.获取原文 (查找原文数据库除外 )
第四节 检索语言检索语言是根据文献检索需要创造的一种人工语言,又称检索标识。从反映文献特征的角度来看,那些 代表了文献外表特征的著者姓名、题名、报告号、标准号、
专利号、档案号等 检索标识和 代表了文献内容特征的类号、叙词、标题词和关键词都是检索语言。从检索标识规范化的角度来看,检索语言可分为自然语言检索标识和规范语言检索标识。
一、体系分类法和分类检索语言体系分类法是一种直接体现知识分类的等级制概念标识系统,是通过对概括文献信息内容及某些外表特征的概念进行逻辑分类 (划分与概括 )和系统排列而构成的。体系分类法的主要特点是按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类检索文献信息的途径。
所谓,类,,是指具有共同属性的事物的集合。
目前在我国通用的主要分类法是,中国图书馆图书分类法,(中图法 )和,中国科学院图书馆图书分类法,(科图法 )。,中图法,是国家推荐统一使用的分类法,被许多检索工具采用或改编,分 5大部类 22大类,类号采用汉语拼音字母与阿拉伯数字的混合号码,用一个字母代表一个大类,
以字母的顺序反映大类的序列,在字母后用数字表示大类下类目的划分,数字的设臵尽可能代表类的级位,并基本上遵从层累制的原则。
二、主题法与主题检索语言主题检索语言是直接以代表文献内容特征和科学概念的词汇作为检索标识。主题语言可分为标题语言、叙词语言和关键词语言。 主题法最常用的有叙词法 (descriptor)和标题法 (subject heading)。前者采用表示单元概念 的规范化语词的组配来对文献内容进行描述,是一种后组式词汇标识系统;后者使用一个或者一组规范化的自然语言作为检索标识来描述文献的内容,是一种先组式的词汇标识系统。它们的优点是:在表达主题内容方面具有较大的灵活性,抛弃了人为的号码系统,代之以通用的规范语言,并在各主题之间建立有机的参照系统,代替了等级制的直线排列。它使用组配和索引等方式,较好地满足多元检索的要求。
第五节 检索方法及检索途径一、检索方法查找 (Searching)就是实施检索策略、搜寻所得文献信息的过程。以下几种方法,无论是计算机还是手工检索,都是常用的方法。
1.“拉网法,
在不了解查询某一专题信息的 URL地址时,可从提供信息总目的 Web 页面开始浏览,沿着专题链接层层查找,直至找到有关的内容为止。然后用,书签,保存这个页面的 URL,转向另一个分支。
这种方法可以迅速获得较多的相关地址,然后进行筛选。就使用引擎而言,国外专家也建议先用链接页面多、响应时间快的引擎。
2.引文法 (跟踪法 )
文献之间的引证和被引证关系揭示了文献之间存在的某种内在联系,引文法 (也有称为跟踪法 )就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。这些材料指明了与用户需求最密切的文献线索,往往包含了相似的观点、
思路、方法,具有启发意义 。
引文法又可分为两种,一种是由远及近地搜寻,
即找到一篇有价值的论文后进一步查找该论文被哪些其它文献引用过,以便了解后人对该论文的评论、是否有人对此作过进一步研究、实践结果如何、最新的进展怎样等等。由远及近地追寻,
越查资料越新,研究也就越深入,但这种查法主要依靠专门的引文索引,如,科学引文索引,,
,社会科学引文索引,。
另一种较为普遍的查法是由近及远地追溯,这样由一变十,由十变百地获取更多相关文献,直到满足要求为止。这种方法适合于历史研究或对背景资料的查询,
其缺点是越查材料越旧,追溯得到的文献与现在的研究专题越来越疏远。因此,最好是选择综述、评论和质量较高的专著作为起点,它们所附的参考文献筛选严格,
有时还附有评论。
3.常规法所谓常规法就是利用常规检索工具查找有关文献的方法,是信息时代应掌握的最基本的信息查找方法。现在对文献的书目控制手段已日趋完善,各种印刷版、缩微版、光盘版和网络版的检索工具层出不穷,有很大的挑选余地。用户应根据自己的检索知识和条件选用一种或几种检索工具。 常规法可分为顺查法、逆查法和抽查法。
顺查法是以课题研究的起始年代为出发点,利用选定的检索工具如书目、索引、文摘由远及近地逐年查找;逆查法则相反,是由近及远地查找,起点是从最近发表的文献开始,直到设定终止的年代或查到所需资料为止。两种方法适用于研究范围广、研究历史较悠久、课题较大的咨询。也可用于解答那些无法准确确定答案在什么时间范围内的咨询。抽查法是基于这样一个规律来查文献的,即任何一门学科的专题研究大体都像波浪起伏般地发展,时而高潮,时而低潮。
由于兴旺时期发表的文献量大,各种学术观点较为集中,如果针对课题研究处于兴旺时期的若干年查找,
则付出较少的时间可获得较为满意的检索结果。
4.排除、限定和合取法这实际上是将信息加工的方法融入检索中去。思维中使用 排除这一概念,是指对查找对象的产生和存在的状态在时间和空间上加以外在否定。 把这一方法移植到检索中,就是在时间或空间上极大地收缩检索范围。 限定法是相对于排除法而言的,指对查找对象在时间和空间上加以内在的肯定 。排除的结果必然是限定,
反之亦然。
如果把不同资料中涉及所需信息的记载都截取下来,汇集在一起,再经过去粗取精、去伪存真地加工,
构成一个完整的答案,这就是合取法。 采用这 -方法,
不仅要对各类工具书触类旁通,灵活运用,还要学会分析来自各方面的庞杂的材料。合取并不是一加一等于二式的材料拼凑。在检索时,也不能局限在,一把钥匙开一把锁,式的思维方式中,特别是碰到复杂的难题或大课题时,要注意,(1) 善于跨种类地综合利用各种类、
各文种的参考工具书,注意比较它们各自的特点,有步骤、按次序地进行查找; (2) 不仅要利用二次文献,还要注意利用一次文献和三次文献; (3) 不仅要利用文字资料,还要注意利用图象资料; (4) 不仅要利用电子信息,也要考虑缩微资料、印刷品和档案材料; (5)不仅要注意参考工具书的正文,还要充分利用其附录。
二、检索途径所谓检索途径就是检索时切入信息群体的路径。 检索途径有两大类,一类是用信息的外部特征,如题名、责任者、某种序号、机构名等作为检索标识;另一类是用能够描述信息内容的分类号、关键词、
主题词等作为检索标识。在数据库中检索时,几乎所有的字段都可以作为检索的途径。
(一)分类号检索(分类检索)
这种检索是根据信息内容的学科分类来进行的。最大的优点能保证信息的系统性,而且具有较好的族性检索功能。
分类检索的要点,1。对待检课题的概念及学科间的各种关系清楚; 2。正确掌握相关课题的分类名称、分类号,手工检索中掌握工具的分类排检。
分类检索的步骤:
1。分析待检课题,确定其学科,并弄 清学科间的各种关系。
2。查出待检课题的分类号(工具简单时可以 省略)
3。选择适当的检索工具
4。进入检索系统后选择分类号途径,并在对话框内输入分类号,开始检索。
5。对比题目,阅览相关信息,选出所需信息,并下载相关信息
6。原文的索取
(二)词汇检索与分类号检索相比,词汇检索具有直观、灵活、专指性和适应性好的特点,同时检索速度也比分类检索快。
词汇检索的要点:首先是要选好检索词,正确理解词间关系,检索中还要注意词间关系的正确表达。 常用的词汇检索有关键词检索和主题检索。计算机检索时,
选择任意字段检索时,检索项也可以是各种词汇。
词汇检索的步骤:
a,分析课题,确定检索词及词间关系
b、选择适当的检索工具
c、选择词汇检索途径,在对话框内输入检索词
(注意词间关系的表达)
d,根据快捷显示,选出有用信息并下载。
e,原文的索取其他检索途径
1、题名检索
包括书名、刊名、篇名和其他信息的标题等
2、作者
3、机构
4、号码
分类号,报告号、登记号、专利号,ISBN,ISSN
记录号等
5、来源
6、其他特殊途径第六节 信息检索工具
1、搜索引擎、元搜索引擎; Google,Alltheweb、百度飓风搜索通,iTools
2、网络资源目录,yahoo,BUBL LINK
3、各类网站,http://sosig.esrc.bris.ac.uk,www.eric.ed.gov、
www.collgenet.com,www.petersons.com、国家精品课程导航,EconWPA,www.lawinfochina.com
4、学术性检索系统,ISI Web of Knowledge,OVID,OCLC、
CNKI平台,NSTL,CSDL,CALIS、维普资讯、万方数据系统
5、数据库
6、二次文献、工具书
7,线索检索工具、原文检索工具、馆藏检索工具第六节 信息检索工具
1、搜索引擎、元搜索引擎; Google,Alltheweb、百度飓风搜索通,iTools
2、网络资源目录,yahoo,BUBL LINK
3、各类网站,http://sosig.esrc.bris.ac.uk,www.eric.ed.gov、
www.collgenet.com,www.petersons.com、国家精品课程导航,EconWPA,www.lawinfochina.com
4、学术性检索系统,ISI Web of Knowledge,OVID,OCLC、
CNKI平台,NSTL,CSDL,CALIS、维普资讯、万方数据系统
5、数据库
6、二次文献、工具书
7,线索检索工具、原文检索工具、馆藏检索工具第七节 基本检索技术
1、布尔检索
AND(默认、空格,+,all of these words)
OR( 必须大写,关键词 1、关键词 2,|,/,any of
these words)
NOT( -,none of these words)
NEAR
2、截词检索 ( *、?)
综合搜索引擎一般不支持截词检索
下面以“计算机”和“文献检索” 两个词来解释三种逻辑算符的含义。
① 计算机” AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。
② 计算机” OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。
③ 计算机” NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。
这里需要说明的是,在 Windows 环境下,尤其是在中文数据库及网站中,逻辑检索可以用算符将检索要求编成综合表达式向计算机一次输入检索提问,也可以用窗口上的逻辑指令按钮(与、或、
非)进行分步组配提问和检索。
2,截词检索截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。按截断的位臵来分,截词可有后截断、前截断、中截断三种类型。按截断字符数量分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。
不同的系统所用的截词符也不同,常用的有?,$、
*等。分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。
绝大部分数据库的无限截词用,*”,少数数据库用“?”或者,$”。下面以联机检索系统的无限截词?举例说明:
① 后截断,前方一致。 如:在某些联机检索系统输入,comput?”表示 computer,computers、
computing等。
② 前截断,后方一致。 如:在某些联机检索系统输入“? computer”表示 minicomputer、
microcomputers等。
③ 中截断,中间一致。 如:在某些联机检索系统输入“? comput?”表示 minicomputer、
microcomputers等。
3、位臵检索
位臵检索一般用用来限制检索项之间的位臵关系和前后次序。其目的是增强检索项组配的灵活性,更准确地表达复杂的检索概念。常用的位臵算符有以下几种:
①邻近位臵算符( W)
( W)算符也可以简写为()算符,A( W) B,
表示 A紧挨着 B,并且顺序不能颠倒。 A和 B之间除允许有一个空格、一个标志符号或一个连接号以外,
不得插入任何单位或字母。
②邻词位臵算符( nw)
A(nw)B,表示两个词的次序不变,其间可以插入 n
个词。
③ 句子位臵算符( S)
A(s)B,表 A和 B必须同时出现在记录的同一个句子或短语中,
但次序可能随意改变,A与 B之间可以有若干个其他的词。
④字段位臵符( F)
A( F) B,表示 A和 B 必须同时出现在记录的同一个字段之中,但位臵和次序不限,两者之间还可以任意加词。如
Rice(F)Genetics/Ti 要求 Rice和 Genetics必在同时出现在篇名之中。
(字段标识符,TI,AU,AB,SO,PY,LA,DE,TN)
⑤记录位臵算符( C)
A( C) B 其作用等同于 A and B,均表示 A和 B同时出现在同一记录内,但词序不限,也不要求在同一字段内。
4、加权检索
这种检索是对检索词之间的关系从量上加以限制。通过判定检索词或字符串在检索中对信息命中与否的影响程度,
根据权值的大小依序输出结果。
5、字符串检索(词组检索或短语检索)
这种检索将字符串当作一个独立的运算单元,进行严格地匹配。
6、概念检索
同时对同义词、近义词、广义词、狭义词进行检索。
7、深入检索(二次检索)
指在检索结果中作进一步查询,以得到更精确的结果。
8、模糊检索与精确匹配
9、自然语言检索 ( Ask Jeeves)、实名检索( 3721)
10、组合检索:
检索项组合、检索途径组合、分次检索结果组合等、
11,限定检索
就是将检索词限定在一定的范围内进行检索
( 1) 限定网站
【 实例 】
输入,金庸 古龙 site,sina.com.cn”搜索包含,金庸,和,古龙,的中文新浪网站页面 。
( 2) 限定网页
【 实例 】 输入,inurl:midi 沧海一声笑,查找 MIDI曲,沧海一声笑,。
【 实例 】 输入 inurl:"plog/register.php",搜索 plog注册文件
(现在用的很普遍的一套 PHP博客程序,在其安装说明中明确说明希望用户安装后删除 register.php文件 )。
【 实例 】 输入,inurl ecurity windows2000
site:microsoft.com”查找微软网站上关于 windows2000的安全课题资料 。
( 3) 限定标题
【 实例 】 输入,intitle,张娜拉 写真,查找韩国小可爱张娜拉的照片集 。
( 4) 限定文件类型
【 实例 】 输入 filetype:lit lit (books|ebooks),搜索网络图书 ( FILETYPE可以更换 ) 。
【 实例 】 利用后缀名来搜索电子书,输入,存在与虚无 chm”,,菜根谭 exe”,,水煮三国 chm,。
( 5) 其他类型限定
【 实例 】 输入
,related:www.sina.com.cn/index.shtml”搜索所有与中文新浪网主页相似的页面
【 实例 】 输入
,cache:www.giantdot.com/GB/politics/index.asp”
查找某 IP被封的网站页面。
【 实例 】 输入 pwd inurl:(service or authors or
administrators or users),搜索密码文件 。
第八节 检索结果评价及修正
l 一,信息检索结果评价
l 信息检索结果与检索要求常常不一致,原因来自两个方面,一是检索工具和检索系统本身的问题,如检索工具收录的信息不全,标引深度不够,导致系统只能回答信息提问,
而不一定能够满足信息需求等 。 二是用户的问题,一般来说,
用户只能够大概表述自己的提问,而不能确切的衡量文献信息与提问的切题程度 。 加之随着学科的发展,检索课题日趋复杂,可能出现令人不满意的检索结果 。 因此,需要对检索结果进行评价,以准确了解检索系统的各种性能水平,分析影响检索效果的因素,及时调整检索策略,提高检索效果 。
(一)评价检索结果的主要指标检索效果是指用户对检索系统实施信息检索的有效程度,也是系统满足用户信息需求的程度,检索效果同时反映了检索系统服务能力和用户的检索能力 。 按照特性不同,可以将检索效果分为技术效果和经济效果 。 其中,技术效果由检索系统完成各种功能的能力,用户的操作能力以及对检索课题的把握能力等因素决定;经济效果由检索系统完成各种功能以及用户达到自己检索目的所花费的成本和时间来决定 。
评价检索效果的两个重要指标是查全率和查准率 。
1,查全率:又称为检全率或命中率,是指检出的相关信息量与检索系统中相关信息总量之比 。
2,查准率:是指检出的符合课题需要的相关信息量与检索出的信息总量之比 。
(二)信息检索结果的影响因子
对于用户而言,最关心的是检索结果,一般来讲,
影响检索结果的 主要因素有文献标引的广泛性和检索标识的专指性 。 标引的广泛性是指标引时揭示文献主题基本概念的广度,是支配查全率的重要因素;检索标识的专指性是指检索标识表达检索主题的专指程度,是支配查准率的重要因素 。
对于检索系统来讲,系统信息存储不全、索引词汇缺乏控制、词表结构不够 完善、标引缺乏详尽性、信息分类的专指度不能精确描述信息主题、组配规则不严密而产生模棱两可和歧义现象等,都是影响查全率和查准率的客观因素。
对于用户来讲,对检索要求的理解不够明确,检索工具选择不恰当,检索途径和方法过少,确定检索词缺乏专指性,组配错误等,都是影响查全率和查准率的主观因素 。
二、检索结果修正
1、信息量过大(正常情况)
应考虑缩小检索范围,提高检索结果的查准率。调整检索策略的方法如下:
(1)减少同义词与同族相关词;
(2)增加限制概念,采用逻辑,与,连接检索词;
(3)使用字段限定,将检索词限定在某个或某些字段范围;
(4)使用逻辑,非,算符,排除无关概念;
(5)调整位臵算符,由松变严,(F) (W)。
2。信息量小(正常情况)
为了提高检全率应尽可能扩大检索范围。
( 1)注意相关和相近领域的检索
( 2)选全同义词与相关词并用逻辑,或,将它们连接起来,增加网罗度;
( 3)减少限制条件
( 4)采用全字段检索
第四章 搜索引擎
4.1 搜索引擎发展概述
1990年 大学生 Alan Emtage,Peter Deutsch等发明了
Archie
1993 年 JumpStation,The World Wide Web Worm
( Goto的前身,也就是今天的 Overture )和 Repository-
Based Software Engineering ( RBSE ) spider 成功检索整个因特网各种信息。 JumpStation 和 WWW Worm只是以命中信息的先后顺序为结果排序,而 RBSE是第一个索引 Html文件正文的搜索引擎,也就是第一个在结果排列中引入关键字串匹配程度概念的引擎。
1994年 Michael Mauldin将 John Leavitt 的 Spider 程序接入到其索引程序中,创建了 Lycos。
同年 4月 David Filo和美籍华人杨致远共同创办了 Yahoo。
1995年元搜索引擎 出现。
4.2 通用搜索引擎
4.2.1 国外搜索引擎
1.Google( www.google.com,
www2.google.com,www3.google.com)
( 1)编制者
Larry Page,Sergey Brin于 1999创立
Google Inc.
( 2)数据库规模与范围
100亿左右的文本文档。
门类齐全。包括普通网页、图像数据库、新闻数据库和
froogle(购物搜索引擎)。此外,大量的政府数据库、大学数据库,Linux数据库和 Microsoft数据库等。
( 3)(检索界面)
( 3)检索界面
( 4)检索功能
①基本检索
支持不完全的布尔逻辑,and,OR,-
OR一定要大写,,-”前要空格。
词组或短语应该加上,”
禁用助词、介词、冠词等
可后截断检索和用 *代替单词中的一个英文字母
英文单词前加上,~,不空格可以单词的单复数形式和近义词。
②网页特色检索
特殊文档检索和字段检索。
③网页目录(分类检索)
④可在结果中二次检索
( 5) Google工具
Google deskbar 可以脱离浏览器使用 Google
Toolbar 安装后可以在任何网页随时使用
Google 而不需要启动首页
www.spoole.com
( 6)评价
30多项世界大奖,完成网络 75%的搜索任务。
世界第一大数据库、界面简单明了、检索功能强,相关性排序技术先进。
2.Alltheweb,//www.alltheweb.com/
( 1)编制者
Fast 公司成立于 1997年,技术起源与挪威科技大学,AllTheWeb( ATW)是该公司的门户网站。
2003年 AllTheWeb被 Overture收购,2004年 3年
Yahoo收购了 Overture
( 2)数据库规模与范围
规模与 Google相当,资源类型包括网页、
Flash,新闻、图片,MP3、视频 video等。
( 3)检索界面

3,MSN www.search.msn.com
由微软编制,大部分数据来源于搜索提供商 Inktomi的数据库以及 Looksmart的人工分类体系,微软的电子百科全书和广告合作商提供的信息也在其中。其资源类型包括网页、黄页白页信息、新闻、地图、音乐、
星座和求职信息等。
检索功能
基本检索:
基本同 Google。不同的是:支持完全布尔检索、不支持截断检索、区分大小写。
网页特色检索,
特殊文档检索 比如能检索微软 Office文 档,
高级检索中更多的文档限定,或者使用 feature:***
字段检索和各种限定检索 (高级检索界面)
特色:
高级检索中能为用户提供多媒体信息参考源,
区分大小写,检索人名、地名和专业词汇优于其他引擎
4,AOL,http://aolsearch.aol.com
( internal),http://search.aol.com,
( external)(美国在线)
50%的美国家庭通过它上网,检索的结果是在 Google
结果集中进一步精选,所以检出量比 Google少,但理论上认为比 Google的精
5,Altavista,www.altavista.com
Altavista是功能非常齐全的搜索引擎,提供常规搜索、高级搜索和主题搜索,据说有 11亿网页,
且搜索精度世界领先,目前它的优势主要是它拥有很强的图形检索和音频、视频检索功能。
4.2.3 国内搜索引擎
1、百度,www.baidu.com
( 1)编制者
1999年底李彦宏和徐勇与美国创建了百度。
( 2)规模和范围
最大的中文搜索引擎之一,全球独有的
“超链分析”技术。除网页、新闻、图片、
地理资源,flash和 mp3外,还有贴吧和一项特殊服务 — 信息快递
( 3)检索功能
空格默认为“与” 或,+”(英文字符)
表示 AND、,|” 表示 OR,,-”(英文字符)
前一空格执行 NOT。
关键次间无空格示为词组。
支持同义词
不具备特殊文档检索
可限制字段检索
高级设置中有其他限制检索。
2、中国搜索 www.zhongsou.com
资源包括 2亿网页、分类目录、新闻、区域、
网站、多万首 70mp3歌曲,2亿多张图片、商品搜索、游戏、和行业数据库等
检索功能:
基本同百度、用,/”表示 OR、仅对 site
字段做检索,即在网址前加 site,搜索具体网站内的网页
网页目录
分类主题一体化查询
行业搜索 开创了搜索引擎行业特性分类、关键字分类搜索的先河。
3,3721,www.3721.com
用实名搜索而不需要用网址。查询非普通网页比其他引擎好。
4、天网,http,//e.pku.edu.cn
仅支持“与”,用空格
,”执行词组检索
太常用的词被忽略
不区分大小写
分类主题一体化查询
5、其他中文搜索引擎