第四章 计算机检索基础与因特网的使用第一节 计算机检索基础知识数据库的一般结构
1.字段、记录、文档
字段是文献著录的基本单元,反映文献外部特征和内容特征的每一个项目,在数据库中就称为字段,在数据库中每一个字段,往往都给予一个字段名。如Title,字段名为TI;Author,为AU;SO为文献来源,AB是文摘字段,PY为出版年份,SN为国际标准书号ISSN,DE为叙词或主题词,CS为著者单位。在某些数据库的检索中,在上机检索前必须了解数据库的字段名。
记录是由若干不同字段组成的文献单元,一个记录在数据库中往往代表一篇文献,在数据库中每一个记录都有一个记录号,与检索工具中的文摘号类似。
文档,由若干数量的记录所构成的数据集合,在一些大型联机检索系统中称作文档。如DIALOG系统中399号文档是美国化学文摘(CA),211号文档是世界专利索引(WPI)。
2.索引(Basic Index)
Basic Index,是由数据库中的某些字段的倒排挡组成,这些字段通常是能够以主题概念检索的字段,如主题词(DE)字段、关键词(ID)字段、篇名(TI)字段等。不同的数据库基本索引的字段有所差别,因而在检索前要先了解该数据库的Basic Index包含哪些字段。
二、国际联机检索系统(On-Line Retrieval)
1.DIALOG系统
DIALOG系统是国际上最著名、规模最大的联机检索系统。目前该系统拥有三台大型计算机,总存贮量共达十八万兆,与两个卫星通信网络相连,在全世界80多个国家和地区有10多万个终端用户,系统每天24小时为用户提供联机检索服务。
2.ORBIT系统
ORBIT系统是目前世界上仅次于DIALOG系统的国际联机检索系统,是始建于60年代的国际著名联机检索系统。文献存储量达1亿条记录,200多个文档。
3.BDS系统
BDS系统是我国最大的联机检索系统,属北京文献服务处。该系统文献存储量达1千余万条,该系统的数据库主要是专利文献和美国政府报告。该系统在全国各地拥有数百个终端用户,由于国内的联机检索费用较低,因而利用率要高于国际联机检索。但国内联机检索数据量太少无法满足各专业的用户需求。
三、布尔逻辑运算
在计算机检索中,逻辑运算是常用的方法。用逻辑运算的方法反映检索词之间的关系,能达到提高检索效果的目的。常用的逻辑运算有三种:逻辑与、逻辑或、逻辑非。
逻辑与:机检的输入符号为“*”或“AND”,是反映概念之间交叉和限定的一种组配。A*B,表示数据库中既含有A概念又含有B概念的文献才被命中。用逻辑与可以逐步缩小文献的检索范围,提高文献命中的准确性。
如:乙烯的水合反应 A:ethylene A*B (交集)
B:hydration A AND B
逻辑或:机检的输入符号为“+”或“OR”,是反映概念之间并列关系的一种组配。A+B,表示在数据库中只要含有A概念或B概念的文献都可命中。用逻辑或可以扩大文献的检索范围,防止漏检,以提高文献的检全率。
如:石油和天然气 A:petroleum A+B (并集)
A B B:natural gas A OR B
逻辑非:机检的输入符号为“-”或“NOT”,A-B,表示在数据库中,在命中含有A概念的文献集合里,去除同时含有B概念的文献。逻辑非也是一种缩小检索范围的概念组配方法,但并不一定能提高文献命中的准确性,往往只是起到减少文献输出量的作用,在联机检索中以降低检索费用。
如:石油炼制催化剂以外的催化剂 A:catalyst A-B
A B B:petroleum refining A NOT B
逻辑运算符是计算机检索过程中广泛采用的一种方法,在各检索词之间合理地、综合运用逻辑运算是提高文献命中准确性和文献的查全率的基本方法,其运算次序为:“NOT”“AND”“OR”,括号中先运算。
练习:
沸石分子筛的吸附 A*B
A:zeolites B,adsorption
顺丁烯二酸酐的制备 A*(B+C)
A,2,5-furandionc B,prepn,C,manuf.
石油和天然气的脱硫 (A+B)*C
A:petroleum B,natural gas C,desulfurization
润滑酯的生产工艺和设备 A*B*C* (D+E)
A,IPC C10M05 B,lubricant C,grease D,technology E,equipment
红外光谱与质谱在石油分析中的应用 (A+B) * (C*D)
A,IR B,MS C,petroleum D,analysis
第二节 网络资源的综合利用
一、如何快速地在网上查找信息目前,日趋完美的网页检索工具也层出不穷,每人都有各人自己的所喜欢使用的网页检索工具,每人的检索方式也大相径庭,这就象每人的生活方式不同一样,我们不可强求统一,但是,我们如果能从众多的检索工具中摸索出一些规律,我们就能提高检索质量、节省时间和精力。
(1)要熟悉了解所检索的主题我们要确切了解我们自己所想要查询的内容。如果我们键入的检索式不正确,有可能导致许多无用信息的产生。当然我们也可以边查边修改我们的检索策略,有时这也是我们的唯一选择,但是,如果我们相当了解我们自己学科的主题,熟悉常用的术语,那么,我们的检索进展就会要顺利得多。举例来说,我们想查找有关以太网方面的信息,这种信息网上太多,如果我们能知道再具体一点的信息,如我们要查的以太网是属于那种范畴(10Mbps和100Mbps)的以太网,这样,我们就能更有的放矢地进行检索。另外,还注意专有名词要大写。
(2)要明确网上的局限性我们知道所有网页检索工具就其检索所要求的查准率和查全率来说是不太高的,同时也不是一上网就可以查到有关学科方面的最新信息,这只是相对而言,有些检索工具还是能检索到一些较新的信息,但网上的信息一般也都滞后,因为检索工具一般也得花数月时间在网上搜寻新资料,而有些动态的网址就其本身性质来说就难以被编成索引。
(3)正确使用布尔逻辑组合式在网上所有一流的网址都容许使用布尔逻辑式,我们一般常用四种布尔逻辑运算符来进行检索:首先是“And”,如当我们在一个检索式中使用A AND B时,我们实际上是通知我们所选择的检索工具在我们所要查找的文献中既要有A也要有B。举例来说,我们要检索与Java有关的数据库,我们就应该这样输入检索式:Java AND database。我们要注意的是有些检索工具的缺省值就是使用AND(yahoo),但并非所有的检索工具都如此,因此,我们在使用每一检索工具之前最好读一读相关的帮助信息,以进一步了解该检索工具的具体特性。在我们上网进行检索时,“OR”可能是用处最少的布尔逻辑运算符,因为它检索出来的信息太多,有许多网上服务器甚至不对带有这种逻辑运算符检索式的请求进行加工。还有些词如“计算机”,太多太泛,失去了检索的价值,我们称这种词为“禁用词”,网上每个检索服务器一般都有自己的禁用词表,如果我们在检索前对此有所了解,我们就有可能避免不必要的误检。另一个比较有效的逻辑运算符是“Not”,我们可以用Not来排除在检索中同名但不同义的词组。但是,我们要注意的是有些检索服务器,如Yahoo和Lycos,不能执行Not逻辑运算符,我们在检索时要考虑这些问题。
二、Internet上的化工资源站点简介
Internet上有丰富的化工信息资源,有关的化工技术人员查询使用可获取大量的学术资料、科技成果。今将部分有名的站点介绍如下。
(一)专业站点
1化工“虚拟图书馆”(http://www.che.ufl.edu/www-CHE/outline.html)该网站由美国佛罗里达大学建立,主要为用户提供化工、生物、环境、给排水、能源等方面的技术资料,同时还提供有关标准、专利以及化学制品的价格、制造商和相关服务信息,用户还可免费订阅“化学品交易信息”。该网站连接了许多著名化工站点,通过它可进一步搜寻有关化工信息。
2化学“虚拟图书馆”(http://www.che.ufl.edu/chempointers.html)
3OCLC (http://www.oclc.org)
世界上最大的为读者提供文献信息服务的机构,通过它可方便地检索大量学术资源。
4环境信息(http://envirolink.org)
5美国化学工程师协会(http://www.che.ufl.edu/~aiche/)
介绍部分化工论文及该协会有关活动。
6美国化学学会(http://www.acs.org)
主要内容有美国化学文摘、教育、公共事物、出版物、计算机软件、会议等。
7DIALOG系统(http://www.dialog.com/)
提供相关领域的论文、新闻、统计等在线服务,以及全球100多种报纸及数千种杂志。
8美国化学学会化学文摘CA(http://info.cas.org/ONLINE/)
世界著名科技文摘,提供科技信息的在线检索服务,但需付费建立合法帐号方可使用。
(二)本校图书馆上的数字资源新加坡WorldSciNet
超星电子图书 科大
中国学术期刊全文检索
维普科技期刊文摘索引
Dialog检索
万方数据_科技信息.期刊.商务信息
德国Springer-Link电子期刊数据
EBSCO 全文数据库(ASP和 BSP)
国家科技图书文献中心
燃料与化工
万方数据_学位论文.会议论文(本地镜像)
中华法律网