1
2-3 现代文献和信息资源发展的整体特征一、数量庞大,增长迅速二、时效性强,代谢频繁三、广泛分散,交叉重复四、载文聚散,分布有序五,形式多样,文种复杂附录:社会科学文献的基本特征 思考题与课题
2
一、数量庞大,增长迅速
1,现象描述:据统计,世界图书产量为 80万种 /年,期刊为 10万种 /年,并以 5%的速度增长 。 科技期刊的增长速度更快,每 7~8年就增长一倍;有些新兴学科,每隔 3年左右就翻一番 。 目前,全世界专利文献每年增加 100万件,技术标准增加 20万件,产品样本增加 50~60万件,
会议文献增加 100万篇左右,各种连续出版物 40万种 。
若以信息单位计算,当今每天约有 40亿个信息单位的信息量向全世界发送,年递增速度为 18~20%。
3
2,数学描述,1961年,D,Price在 Science Since Babylon一书中指出:,似乎没有理由怀疑任何正常的,日益增长的科学领域内的文献是按指数增加的,每隔大约 10~15年时间增加一倍,每年增长约 5~7%。,他进一步指出,整个科学系统资金,人力和物力的指数输入是造成科研成果和科技文献指数输出的重要原因;并且认为,科研人员,科研经费与文献量呈 n,n2,n1/2
三个阶数关系 。 通过对科学期刊的历时性研究,普赖斯得出科学文献增长同时间呈 指数函数 关系 。
4
3,图像描述,以历史年代为横轴,以文献量为纵轴,普赖斯描绘了文献增长的指数模型 。 即,F(t)= aebt,a> 0,b> 0,t为时间,a
为条件常数,即 t=0时的文献量,b为时间常数即持续增长率 。
F(t) F(t)= aebt F(t) 科学 期刊
106
104 文摘杂志
t 102 t
1665 1770 1800 1900 1965
5
4,理论研究之进展 。 B·纳里莫夫逻辑曲线增长模型; A·И·米哈依诺夫直线增长模型,F(t)= bt+a。 一般的看法,文献增长经历四个阶段:
缓慢增长的初始阶段,指数增长阶段,线性增长阶段和缓慢增长阶段 。
5,文献增长对文献检索的影响是多方面的 。
勒希尔的分级滑动指数模型,F(t)为文献总量,则在 λ级上的文献量为
[ F(t)] λ,λ为文献的质量等级指标,0≤λ≤1。 具体而言:
(1)λ=1,起码是常规文献 (代表了所有文献 ),F(t)λ=1= aebt;
(2)λ=3/4,起码是有意义的文献,F(t)λ=3/4= [aebt]3/4;
(3)λ=1/2,重要文献,F(t)λ=1/2= [aebt]1/2;
(4)λ=1/4,起码是非常重要的文献,F(t)λ=1/4= [aebt]1/4;
(5)λ=0,头等重要的文献,F(t)λ=0=㏑ a+bt。
6
二、时效性强,代谢频繁文献老化 (Obsolescence)是指文献随着时间推移而使用频次逐渐减少的现象。
2,1文献老化的衡量指标
Half-life,Price’s Index和 Residual utility
2,2文献老化的数学模型负指数模型和伯尔顿 -凯普勒老化方程
7
2,1 文献老化的衡量指标衡量文献时效,一般有 3个指标:
半衰期:指现有活性文献中一半的出版时间,或者说,某一学科或专业被利用的文献总量中,一半文献失去效用所经历的时间。
各个学科领域和文献类型的半衰期 。
普赖斯指数:在某一知识领域内,把对年限不超过 5年的文献的引文数量与引文总量之比当作指数,用以度量文献老化。即 P=
被引文献数量 (≤5年 )/被引文献总量 × 100%。
剩余有益性 。 有益性是指某一年份某一期刊被用户利用的文章的次数,经过若干年后,期刊还保留的有益性即称为剩余有益性 。
8
各个学科领域和文献类型的半衰期
Burton & Kebler 对 9个领域半衰期的测定数据 (1960):
苏联,发明杂志,对各类文献半衰期的统计研究数据:
学科领域 冶金 物理学 化工 机械 生理学 化学 植物学 数学 地质学半衰期 (年 ) 3.9 4.6 4.8 5.2 7.2 8.1 10.0 10.5 11.8
文献类型 图书 科技报告 学位论文 技术标准 连续出版物 产品样本半衰期 (年 ) 10~20 10 5~7 5 3~5 3~5
9
2,2 文献老化的数学模型负指数模型,1970年,英国的 B,C,Brookes提出了科技期刊文献的被引数量随着时间推移的衰减过程服从简单的负指数规律的假设,C(t)= C0e-bt 。 式中,t表示文献的出版年龄 (以 10年为单位 ),
C(t)表示 t年所发表的文献的引用频率,C0为 t= 0时文献被引用的初始量,b为文献老化速度,0< b< 1。
伯尔顿 -凯普勒老化方程,1960年,美国的伯尔顿和物理学家凯普勒发现科技文献衰变曲线并求出了这一曲线的标准公式,Y= 1
- (a/ex+ b/e2x),式中,a+ b=1,Y是被文献量累积百分数 (经过一定时间该学科尚在利用的文献的相对数量 ),x为时间即被引文献出版年龄 (以 10年为单位 ),a,b是因学科专业而变化的常数 。
文献老化规律对信息检索的具有重要的影响 。
10
三、广泛分散,交叉重复科技知识的高度分化和高度综合,使科技文献呈现出高度的离散性和冗余性 。
就离散性而言,同一专业文献分散在众多的相关专业刊物上,与此同时,某一学科或专业的刊物,除刊载本学科或专业的文献外,还刊载其他学科或专业的文献 。 这种离散性使用户无法检索到专业文献的全部;但同时也把用户引入到一个交叉渗透的科技世界,有利于用户思考和研究学科的相关性以及科学发展的网络结构 。
就冗余性而言,科研选题的重复,同一知识内容的不同表现方式等使文献的内容交叉重复现象比比皆是 。
11
四、载文聚散,分布有序
[英 ]文献学家 S.C.Bradford在 1934年发表的 Documentary
Chaos一文中,首次揭示出文献分布的规律 。 Vickery
称之为 Bradford’s Law of Scattering。
4,1布氏定律的基本表述
4,2布氏定律的基础与应用
12
4,1 布氏定律的基本表述如果将科学期刊按某一给定学科的论文刊载量多少,以递减顺序排列起来,就可以将这些期刊分成专门论述该学科的核心区和另外几个区,其中每区期刊的载文量与核心区期刊载文量相等,这时各区的期刊数成 1∶ n∶ n2∶ … 。 n为布氏常数,n> 1,约等于 5。
如果将一定时间内的按载文量等级排序的期刊分为 3个区,使每个区所包含的相关论文数量相等,即恰好等于全部期刊就此学科发表论文总数的 1/3,那么就可以发现,Zone 1所涉及的论文来自数量不多但效率最高的 P1种期刊; Zone 2包括数量较大,效率中等的 P2种期刊; Zone 3包括数量最大但效率很低的 P3种期刊 。
3个区的期刊数量成下列关系,P1∶ P2∶ P3= 1∶ n∶ n2 。
13
4,2 布氏定律的基础与应用布氏定律的基础是科学的统一性和多样性原则 。 科学既是统一的力场,也有着复杂多样的联系 。
布氏定律在信息检索中的应用:
⑴ 测定核心期刊 。 采用载文率,摘引率和流通率等指标来进行 。
⑵ 测定检索工具的完备性 。 对文摘或索引的实际款目数量和摘引的期刊数量进行比较 。
⑶ 测定全检论文总数,估计检索范围,计算检全率等指标 。
14
五、形式多样,文种复杂文献类型复杂多样,尤其是电子型信息资源大量涌现 。 这就要求信息检索不能固守于传统的书本而应当熟练掌握各种类型文献信息,尤其是现代各种数据库的检索技能 。
世界各国出版的科技出版物所有文种有 70~80种,比较常用的也有 7~8种,其分布大体为:英文 50%,德,俄文各占 10%,法文
7%,日文 3%,西班牙文 2%,中文和其他文种则占 18%左右 。
与此同时,各种专业术语和符号越来越多,这些都增加了信息检索和利用的难度 。 据 UNESCO统计,在全世界出版的科技文献中,
有 50%以上的文献是用 50%以上的科学家不懂的语种发表的 。
15
附录:社会科学文献的基本特征社科文献的内容特征社科文献的形式特征社科文献的运动特征
16
社科文献的内容特征较多主观因素,较少客观因素 。 按科学知识所含的主观因素递增排序为:自然科学 → 技术科学 → 社会科学 。
较多相对性,较少绝对性 。 社科理论的提出总是根据某一特定时间段,而科学理论则往往是超越时间的 。
多为定性思辨,较少定量分析 。,分析经济形式,既不能用显微镜,也不能用化学试剂;二者必须用抽象力来代替,。
多为综合性,少有专业性 。 由于社会现象或社会问题的多面性,
社会科学研究中的高度综合并与科技理论相渗透,使得社会科学文献在内容上的综合性比较突出 。
较多依附性,较少独立性 。 社科理论与其创始者的命运息息相关 。
根据 D.Pendlebury和 Garfield等人引文分析,物理,化学等自然科学的不引率为 40%,而在社会科学和人文科学,艺术中,不引率却高达 74.7%和 98%。 这说明社会科学和人文科学存在着严重的学问自体性 。
17
社科文献的形式特征社科信息的术语经常有不统一的现象,同一术语在不同的时间和场合常常会有不同的含义,从而造成一种特殊的语言障碍 。
社科成果常常以专著为主,尤其是在学科发展的常规时期 。 社会科学研究常常具有辩论甚至论战的性质,需要利用较多的资料,
不仅要阐明新结论,而且还要叙述问题的历史演变,研究现状,
不同观点的分析,研究逻辑和过程,这就要求较大的篇幅 。
社科信息的内容除了使用规范的科学语体外,还常常采用政论语体 。 社科文献的风格,结构,语气等也具有一定的信息内容 。
18
社科文献的运动特征分散性较大;
传递有一定的局限性;
老化慢,生命力强 。
19
Chap2 思考题与课题思考题:
1、如何理解文献的概念和构成要素?
2、文献资源有哪些主要特征?
3、如何认识一、二、三次文献的概念和内在联系?
4、怎样看待纸质文献和现代新型文献之间的关系?
5、特种文献主要包括哪些基本类型,各自具有什么特征?
6、什么是核心期刊?经济管理有哪些主要的核心期刊?
7、现代文献和信息资源有哪些整体特征?它们对信息检索有何主要影响?
8、在检索和利用社会科学文献时,应当注意社会科学文献信息的哪些基本特征?
2-3 现代文献和信息资源发展的整体特征一、数量庞大,增长迅速二、时效性强,代谢频繁三、广泛分散,交叉重复四、载文聚散,分布有序五,形式多样,文种复杂附录:社会科学文献的基本特征 思考题与课题
2
一、数量庞大,增长迅速
1,现象描述:据统计,世界图书产量为 80万种 /年,期刊为 10万种 /年,并以 5%的速度增长 。 科技期刊的增长速度更快,每 7~8年就增长一倍;有些新兴学科,每隔 3年左右就翻一番 。 目前,全世界专利文献每年增加 100万件,技术标准增加 20万件,产品样本增加 50~60万件,
会议文献增加 100万篇左右,各种连续出版物 40万种 。
若以信息单位计算,当今每天约有 40亿个信息单位的信息量向全世界发送,年递增速度为 18~20%。
3
2,数学描述,1961年,D,Price在 Science Since Babylon一书中指出:,似乎没有理由怀疑任何正常的,日益增长的科学领域内的文献是按指数增加的,每隔大约 10~15年时间增加一倍,每年增长约 5~7%。,他进一步指出,整个科学系统资金,人力和物力的指数输入是造成科研成果和科技文献指数输出的重要原因;并且认为,科研人员,科研经费与文献量呈 n,n2,n1/2
三个阶数关系 。 通过对科学期刊的历时性研究,普赖斯得出科学文献增长同时间呈 指数函数 关系 。
4
3,图像描述,以历史年代为横轴,以文献量为纵轴,普赖斯描绘了文献增长的指数模型 。 即,F(t)= aebt,a> 0,b> 0,t为时间,a
为条件常数,即 t=0时的文献量,b为时间常数即持续增长率 。
F(t) F(t)= aebt F(t) 科学 期刊
106
104 文摘杂志
t 102 t
1665 1770 1800 1900 1965
5
4,理论研究之进展 。 B·纳里莫夫逻辑曲线增长模型; A·И·米哈依诺夫直线增长模型,F(t)= bt+a。 一般的看法,文献增长经历四个阶段:
缓慢增长的初始阶段,指数增长阶段,线性增长阶段和缓慢增长阶段 。
5,文献增长对文献检索的影响是多方面的 。
勒希尔的分级滑动指数模型,F(t)为文献总量,则在 λ级上的文献量为
[ F(t)] λ,λ为文献的质量等级指标,0≤λ≤1。 具体而言:
(1)λ=1,起码是常规文献 (代表了所有文献 ),F(t)λ=1= aebt;
(2)λ=3/4,起码是有意义的文献,F(t)λ=3/4= [aebt]3/4;
(3)λ=1/2,重要文献,F(t)λ=1/2= [aebt]1/2;
(4)λ=1/4,起码是非常重要的文献,F(t)λ=1/4= [aebt]1/4;
(5)λ=0,头等重要的文献,F(t)λ=0=㏑ a+bt。
6
二、时效性强,代谢频繁文献老化 (Obsolescence)是指文献随着时间推移而使用频次逐渐减少的现象。
2,1文献老化的衡量指标
Half-life,Price’s Index和 Residual utility
2,2文献老化的数学模型负指数模型和伯尔顿 -凯普勒老化方程
7
2,1 文献老化的衡量指标衡量文献时效,一般有 3个指标:
半衰期:指现有活性文献中一半的出版时间,或者说,某一学科或专业被利用的文献总量中,一半文献失去效用所经历的时间。
各个学科领域和文献类型的半衰期 。
普赖斯指数:在某一知识领域内,把对年限不超过 5年的文献的引文数量与引文总量之比当作指数,用以度量文献老化。即 P=
被引文献数量 (≤5年 )/被引文献总量 × 100%。
剩余有益性 。 有益性是指某一年份某一期刊被用户利用的文章的次数,经过若干年后,期刊还保留的有益性即称为剩余有益性 。
8
各个学科领域和文献类型的半衰期
Burton & Kebler 对 9个领域半衰期的测定数据 (1960):
苏联,发明杂志,对各类文献半衰期的统计研究数据:
学科领域 冶金 物理学 化工 机械 生理学 化学 植物学 数学 地质学半衰期 (年 ) 3.9 4.6 4.8 5.2 7.2 8.1 10.0 10.5 11.8
文献类型 图书 科技报告 学位论文 技术标准 连续出版物 产品样本半衰期 (年 ) 10~20 10 5~7 5 3~5 3~5
9
2,2 文献老化的数学模型负指数模型,1970年,英国的 B,C,Brookes提出了科技期刊文献的被引数量随着时间推移的衰减过程服从简单的负指数规律的假设,C(t)= C0e-bt 。 式中,t表示文献的出版年龄 (以 10年为单位 ),
C(t)表示 t年所发表的文献的引用频率,C0为 t= 0时文献被引用的初始量,b为文献老化速度,0< b< 1。
伯尔顿 -凯普勒老化方程,1960年,美国的伯尔顿和物理学家凯普勒发现科技文献衰变曲线并求出了这一曲线的标准公式,Y= 1
- (a/ex+ b/e2x),式中,a+ b=1,Y是被文献量累积百分数 (经过一定时间该学科尚在利用的文献的相对数量 ),x为时间即被引文献出版年龄 (以 10年为单位 ),a,b是因学科专业而变化的常数 。
文献老化规律对信息检索的具有重要的影响 。
10
三、广泛分散,交叉重复科技知识的高度分化和高度综合,使科技文献呈现出高度的离散性和冗余性 。
就离散性而言,同一专业文献分散在众多的相关专业刊物上,与此同时,某一学科或专业的刊物,除刊载本学科或专业的文献外,还刊载其他学科或专业的文献 。 这种离散性使用户无法检索到专业文献的全部;但同时也把用户引入到一个交叉渗透的科技世界,有利于用户思考和研究学科的相关性以及科学发展的网络结构 。
就冗余性而言,科研选题的重复,同一知识内容的不同表现方式等使文献的内容交叉重复现象比比皆是 。
11
四、载文聚散,分布有序
[英 ]文献学家 S.C.Bradford在 1934年发表的 Documentary
Chaos一文中,首次揭示出文献分布的规律 。 Vickery
称之为 Bradford’s Law of Scattering。
4,1布氏定律的基本表述
4,2布氏定律的基础与应用
12
4,1 布氏定律的基本表述如果将科学期刊按某一给定学科的论文刊载量多少,以递减顺序排列起来,就可以将这些期刊分成专门论述该学科的核心区和另外几个区,其中每区期刊的载文量与核心区期刊载文量相等,这时各区的期刊数成 1∶ n∶ n2∶ … 。 n为布氏常数,n> 1,约等于 5。
如果将一定时间内的按载文量等级排序的期刊分为 3个区,使每个区所包含的相关论文数量相等,即恰好等于全部期刊就此学科发表论文总数的 1/3,那么就可以发现,Zone 1所涉及的论文来自数量不多但效率最高的 P1种期刊; Zone 2包括数量较大,效率中等的 P2种期刊; Zone 3包括数量最大但效率很低的 P3种期刊 。
3个区的期刊数量成下列关系,P1∶ P2∶ P3= 1∶ n∶ n2 。
13
4,2 布氏定律的基础与应用布氏定律的基础是科学的统一性和多样性原则 。 科学既是统一的力场,也有着复杂多样的联系 。
布氏定律在信息检索中的应用:
⑴ 测定核心期刊 。 采用载文率,摘引率和流通率等指标来进行 。
⑵ 测定检索工具的完备性 。 对文摘或索引的实际款目数量和摘引的期刊数量进行比较 。
⑶ 测定全检论文总数,估计检索范围,计算检全率等指标 。
14
五、形式多样,文种复杂文献类型复杂多样,尤其是电子型信息资源大量涌现 。 这就要求信息检索不能固守于传统的书本而应当熟练掌握各种类型文献信息,尤其是现代各种数据库的检索技能 。
世界各国出版的科技出版物所有文种有 70~80种,比较常用的也有 7~8种,其分布大体为:英文 50%,德,俄文各占 10%,法文
7%,日文 3%,西班牙文 2%,中文和其他文种则占 18%左右 。
与此同时,各种专业术语和符号越来越多,这些都增加了信息检索和利用的难度 。 据 UNESCO统计,在全世界出版的科技文献中,
有 50%以上的文献是用 50%以上的科学家不懂的语种发表的 。
15
附录:社会科学文献的基本特征社科文献的内容特征社科文献的形式特征社科文献的运动特征
16
社科文献的内容特征较多主观因素,较少客观因素 。 按科学知识所含的主观因素递增排序为:自然科学 → 技术科学 → 社会科学 。
较多相对性,较少绝对性 。 社科理论的提出总是根据某一特定时间段,而科学理论则往往是超越时间的 。
多为定性思辨,较少定量分析 。,分析经济形式,既不能用显微镜,也不能用化学试剂;二者必须用抽象力来代替,。
多为综合性,少有专业性 。 由于社会现象或社会问题的多面性,
社会科学研究中的高度综合并与科技理论相渗透,使得社会科学文献在内容上的综合性比较突出 。
较多依附性,较少独立性 。 社科理论与其创始者的命运息息相关 。
根据 D.Pendlebury和 Garfield等人引文分析,物理,化学等自然科学的不引率为 40%,而在社会科学和人文科学,艺术中,不引率却高达 74.7%和 98%。 这说明社会科学和人文科学存在着严重的学问自体性 。
17
社科文献的形式特征社科信息的术语经常有不统一的现象,同一术语在不同的时间和场合常常会有不同的含义,从而造成一种特殊的语言障碍 。
社科成果常常以专著为主,尤其是在学科发展的常规时期 。 社会科学研究常常具有辩论甚至论战的性质,需要利用较多的资料,
不仅要阐明新结论,而且还要叙述问题的历史演变,研究现状,
不同观点的分析,研究逻辑和过程,这就要求较大的篇幅 。
社科信息的内容除了使用规范的科学语体外,还常常采用政论语体 。 社科文献的风格,结构,语气等也具有一定的信息内容 。
18
社科文献的运动特征分散性较大;
传递有一定的局限性;
老化慢,生命力强 。
19
Chap2 思考题与课题思考题:
1、如何理解文献的概念和构成要素?
2、文献资源有哪些主要特征?
3、如何认识一、二、三次文献的概念和内在联系?
4、怎样看待纸质文献和现代新型文献之间的关系?
5、特种文献主要包括哪些基本类型,各自具有什么特征?
6、什么是核心期刊?经济管理有哪些主要的核心期刊?
7、现代文献和信息资源有哪些整体特征?它们对信息检索有何主要影响?
8、在检索和利用社会科学文献时,应当注意社会科学文献信息的哪些基本特征?