第一章 科技文献信息概述
第一节 信息、知识文献
第二节 科技文献的类型
第三节 科技文献信息的分布规律
1、信息的概念
信息这一概念首先是由 C.E.Shannon和
W.Weaver提出来的,他们试图给信息一个正
式的和定量的定义,从通信工程、计算机和电
信的角度出发,把一个消息中携带的信息量的
大小用比特 (bit)来度量。
第一节 信息、知识文献
他们从不同学科方向出发,有不同的观点。
哲学家认为:信息是人类认识世界的依据,
数学家认为:信息是一种概率,
物理学家认为:信息是,熵,,
通信学认为:信息是,不定度,的描述。
图书信息领域的专家认为,信息是可以以各种
形式进行传播、记录、出版及发行的观念、
事实及论著。
学者们的见解,
经典工具书的定义,
我国, 辞海, 对信息的释义是:音讯、消息;通
讯系统传输和处理的对象,泛指消息和信号的具体
内容光焕发和意义。
美国, 韦氏字典, 对信息释义为:接受由他人传
来的知识,这些知识是由他们通过调研和学习获得
的;从特定的事件或状况下,如消息、新闻、通知
中获得的知识;用来传播的事实和数据。
信息普遍存在于自然界,人类社会和思维领域。
自然界与人类活动的事实及人类对它们的认识
和创造是信息的内容组成,而载体记录和媒体传播
则是信息存在的物理形式。
现在信息呈现的类型多样,包括:文字、
图片、图形、广播、电视、电话通话、
语音、音乐、影视、数据库等等。信息
量与日俱增,如世界收藏量最大的信息
资源中心美国国会图书馆的信息量就达
到 3P(Pet bytes,即 10^15 bytes)。
信息的结构图
其中,
Data-信息的原材料
Information-由人提供
的有组织的数据
Knowledge-对信息的理
解与认识
Wisdom-精炼的知识
信息的特点
信息具有时效性、传递性、可扩散性、可扩
充性、可替代性和 共享性。
社会的进步赋予信息更丰厚的内涵,信
息的膨胀与人们对其需求的激增,使信息成
为当今社会生活的一大支柱,成为一种与能
源、材料并存的重要战略资源。
2 知识与文献
知识,是人类对信息、对客观事物规律的认
识,它是人们在社会实践中积累起来的经验。
人们对事物由表及里、由现象到本质、由感性
到理性的认识深化,便形成了知识。知识是信
息内容的组成部分。
文献,我国, 国家标准文献著录总则, 对文
献有如下定义,记录有知识的一切载体。
文献的三个基本要素 是,
知识, 载体 和 记录 。
3 文献的社会功能
知识的积累、传播与创造
文献积累着知识,保存着人类文化遗产,它汇
集人类创造的精神财富,是知识的宝库。
研究成果的确认与评价
文献,特别是科技文献中记载有学术研究的
成果,同时也记录有从事研究的人和完成研究的
时间,这是对人的确认,也是对研究水平衡量的
重要依据。从文献发表的数量、质量及其波及的
范围和产生的影响、被他人引用的情况等统计分
析,可以对个人、团体以致国家的研究实力、水
平和前景作出客观、公正、公平和公认的评价。
4 现代信息的特征
? 数量巨大
? 分布离散
? 更新加快
下表数据来自, 中国出版年鉴 1997》,对我国
500多家出版社的图书和期刊出版的统计。
分布离散
信息的可扩散性、可替代性,反映在文献方
面则表现为其分布离散重复的现象。
现代科学技术的发展及其相互渗透,许多
新兴学科、边缘学科、交叉学科不断涌现。
专利文献的重复率达 65%,科技报告的重
复率甚者可达 80%。会议上发表的论文,大约
有 40%会在期刊上报导。
要自如地去对付这样一种文献分布局面,
就需要我们在查询文献、信息时应用适当的方
法、技巧去有效地获得比较满意的结果。
更新加快
新思想、新概念、新理论、新技术、新工
艺、新产品、新成果的层出不穷,新老知识更
新的频繁,文献有效利用时间缩短,失效加快
则是不可避免的。
一般认为百分之八、九十的科技文献的使
用寿命为五至七年。
终身学习,不断去跟踪、获取最新信息、
知识、文献,去创新,这对每个科技人员来说
是至关重要的。
1、按科技文献的出版形式划分
( 1)科技图书 ( 6)科技报告
( 2)科技期刊 ( 7)政府出版物
( 3)会议文献 ( 8)标准文献
( 4)专利文献 ( 9)科技档案
( 5)学位论文 ( 10)产品样本
第二节 科技文献的类型
( 1)一次文献( Primary Document)
一次文献通常是指著者以自己的研究成果为基础创作或撰
写的文献。一次文献又称原始文献。书、刊、会议论文等。
( 2)二次文献( Secondary Document)
二次文献是指文摘、题录、目录等检索工具。二次文献的
生成过程即是对知识信息有序化的二次加工过程 。
( 3)三次文献( Tertiary Document)
用科学方法和专业知识对二次文献进行综合的深入研究之
后而撰写出的文献。 如综述、述评、专著 等文献型,字典、
词典、辞典、百科全书、专题目录、数据手册等 数据型 。
2.按文献加工处理的深度划分
( 1)印刷型文献
印刷型文献是以纸张为存储介质,以印刷、复印、打印、手
写等方式为记录手段而生成的一种传统的文献形式。
( 2)缩微型文献
缩微型文献是以诸如胶卷、胶片等感光材料为存贮介质,以
缩微照相为记录手段而生成的一种文献形式。
( 3)声像型文献
声像型文献是以磁性材料、感光材料为存贮介质,以磁记录
或光学技术为记录手段直接记录音频、视频信息而生成的一种文
献形式。
3.按科技文献的载体形式划分
机读型文献是一种以磁性材料、感光材料为存贮介质,以
计算机或其他设备为录入手段的新型电子文献。机读型文献可
分为三种类型:传统型、光盘型、网络型。
网络型文献的载体是一种新型的载体形式 ——网络。网络
型文献的特点是,以网络为传播媒体,以多媒体为内容特征,
以多样性、互交性方式进行传播。
机读型文献的优点是,① 存贮密度高,存取速度快。 ② 可
对输入的信息进行任意的组织、处理。 ③ 输入输出方式及形式
多样化。 ④ 可实现文献信息的自动化、多途径检索。 ⑤ 对文献
的存取、检索可不受时空限制。 ⑥ 有利于保护环境、节约能源。
其缺点是 ① 须借助计算机等设备。 ② 需必要的系统环境及技术
条件作支撑。 ③ 综合投入及费用较多。
( 4)计算机可读型文献
该指出的是, 随着文献交流渠道的扩大及增
加, 随着科学技术特别是信息技术的迅速发展, 科
技文献类型之间的耦合现象也日趋明显 。 如, 有的
文献以会议论文的形式发表的同时, 还可能以期刊
论文或科技报告的形式发表;又如, 随着多媒体技
术的发展, 声像型文献同时也是计算机可读的, 计
算机可读型文献也可以具有图音并茂的声像效果,
印刷型的文献同时出版网络版 。
文献类型的发展趋势:正在朝数字化和多媒体
方向发展 。

一、科技文献的时间分布规律
1,科技文献增长律
( 1) 科技文献指数增长律
研究结果表明, 科技
期刊数量和期刊文献数量均
呈现出, 按指数增长的规律, 。
第三节 科技文献信息的分布规律
通过对该曲线的分析研究,普莱斯注意到了科技文献
增长与时间之间的关系可以用指数函数来表述。其表达
式如下,
( 2-1)
式中 F( t) 是时间 t 的函数, 表示 t 时段的科技文献量;
a 为条件常数, 表示统计的初始时段 ( t = 0) 时的科技文
献量; e为自然对数的底数 ( e=2.7138) ; b为时间常数,
表示科技文献的年增长率 r%。
普莱斯指数函数模型
格 ·弗 莱杜茨 ( Γ.Влэдуц) 和弗 ·纳里莫 夫
( В.Налимов) 等人提出了科技文献按逻辑曲线
增长的理论和模型 。 表征科技文献逻辑增长的数
学公式为,
(2-2)
式中 F( t) 为 t年的文献累积量, k为 t→∞ 时科技
文献的累计量, 即科技文献累积量的最大值, a,
b为参数 。 如果把这一数学模型用图表示, 则科技
文献的逻辑增长曲线如图 2—2。
( 2)科技文献逻辑增长率
由图 2—2所示科技文献逻辑增长
曲线呈, S”型。若对式 2-2中的时间
变量 t二阶求导,并令二阶导数为 0,
则可知曲线的拐点 A的坐标为
( lna/kb,k/2)。
应当指出,在表征科技文献增长
规律方面,逻辑曲线比普莱斯曲线更
符合客观实际。但逻辑曲线也其局限
性,它表明科学技术发展到一定阶段
是,科技文献的增长率趋于零科技文
献总量将达到不可逾越的最大值 k,
这显然是与实际情况不相符的。
科技文献逻辑增长曲线
科技文献产生后,随着时间的推移,其流通及
利用情况会发生变化。
? 有些文献的内容会被之后的证明是不可靠的或
错误的。
? 有些文献信息的内容尽管仍是正确的,被 新的
文献形式所替代,导致原有文献逐渐很少被人使用。
科技文献的这种逐渐失去使用价值而不再被人
们利用或越来越少地被人利用的现象就是科技文献
的老化现象 。
2、科技文献老化律
普莱斯经过研究,将科
技文献的老化过程用图
2—3所示的负指数曲线来
描述。一般来讲,利用半
衰期及普莱斯指数等具体
指标来衡量文献的老化过
程,能够比较客观地反映
科技文献老化的规律。
普莱斯老化曲线
所谓科技文献的半衰期,是指某学科领域现
实尚在使用的全部文献中新的一半文献的发表年
限所覆盖的时段。
国外学者巴尔顿和凯普勒, 为了进行, 半衰
期, 的具体测算, 提出了一个被称之为巴尔顿 -凯
普勒老化方程的计算公式,
(2-3)
必须指出的是, 科技文献半衰期针对专业学科
文献集合而言的统计意义上的概念 。
( 1), 科技文献的半衰期
根据( 2-3)式,当取 y=0.5时,可以计算
出文献的半衰期。巴尔顿等人据此测算出生物
医学、冶金工程、物理学、化学工程、社会学
等 12各学科的文献半衰期,其结果如下表所示,
学科 半衰期
科技文献半衰期针对专业学科文献集合而言
的统计意义上的概念。它所指的对象是某一学科
或专业领域的文献总和,而不是单指文献个体或
某一组文献。另外,式( 2-3)只考虑到了, 老
化, 本身,而未考虑促使科技文献老化的其他因
素。故表 2-1所示测算结果与文献老化的实际情
况有一定的偏差 。
必须指出
普莱斯把发表时间超过 5年仍被利用的科技文献定义为
,档案性文献,,把发表时间在 5年之内的, 新, 文献定义
为, 一般性文献,,并将, 新, 文献的引用数量与文献的总
引用量之比为指数,作为衡量科技文献老化的测度。
, 普莱斯指数, 的表达式为,
普莱斯指数 =,新, 文献引用量 /文献总引用量 ( 2-4)
普莱斯认为, 这一方法及可以用于某一领域的全部文献,
亦可用于评价某种期刊, 某一机构, 某一著者及某篇文献 。
, 普莱斯指数, 数值越高, 表明, 新, 文献被引用量
就越多, 文献老化的速度就越快;数值越低, 表明, 新, 文
献的被引用量就越少, 文献的老化速度就越慢 。
( 2).普莱斯指数
? 科技文献的时间分布规律可以给我们如

? ① 以文献量的变化作为衡量知识增长和技术
发展状况的指标,推断出科学知识及科学技
术的指数增长和逻辑增长的规律。
? ② 可以根据文献的时间分布规律解决好时间
序列上的信息选择问题,充分合理地利用科
技文献信息,更有效地从事教学科研活动。
? ③ 可以根据文献的时间分布规律确定合理的
文献保存年限,无论对图书馆馆藏文献的管
理,还是对私人藏书的取舍都是有益的。
启示
1、布拉德福定律
布拉德福认为:科学技术的每一个学科都或多
或少,或远或近地与其他任何一个学科相关联,
从而导致一个学科的文献出现在另一个学科的期
刊杂志之中,这就是从学科角度对文献分散规律
的描述。
这里的, 相关学科, 期刊的数量与, 用户所在
学科, 的期刊数量是有关系的。布拉德福对相关
期刊所载论文的数量进行了大量的统计研究,并
推导出定量的文献分散定律。
二、科技文献的空间分布规律
布拉德福定律的区域描述可表述为:若将科学
期刊按其刊载某一学科文献数量的多少, 以递减顺
序排列, 便可把期刊划分为直接服务于该学科的核
心区域及其他几个区域, 每个区域的期刊所载的文
献总数相同 。 这时, 核心区域与相继各区域的期刊
数量呈 1, a, a2 …… 的关系 。
n1, n2, n3 = 1, a, a2 ( a > 1) ( 2-4)
a是一比例常数, 或称布拉德福常数 。 布氏经统
计分析得出, a值大约为 5.0。 对于不同的学科专业
而言, 其 a也不尽相同 。
2.布拉德福定律的区域描述
科技文献的空间分布规律主要可以给我们如
下启示,
① 可以发现科学技术及学科专业间的相互关系
( 学科技术之间的远近亲疏, 交叉渗透关
系 ) 。
② 可以帮助人们更好地解决空间范围内的文献
信息选择问题, 更有针对性地获取利用科技
文献 。
③ 可使文献信息部门或个人确定最佳的文献搜
集范围
启示
作业
1,你对本课程有哪些了解?希望在本课程中学到哪些知识?
2,信息、文献和知识的基本概念?
3,文献的主要社会功能?
4,现代科技文献的主要特征?
5,根据文献的信息内容加工深度的不同,文献有哪些类型?
它们的特点是什么?
6,根据文献的媒体形式的不同,文献有哪些类型?它们的特
点是什么?
7,根据文献的出版形式的不同,科技文献有哪些主要类型?
它们的特点是什么?
8,文献的时间分布规律?给我们的启示?
9.文献的空间分布规律?给我们的启示?