玫瑰与百合分享 http://blog.sciencenet.cn/u/renquane

博文

网络环境下的对数透视原理

已有 7956 次阅读 2009-9-8 15:36 |个人分类:网络计量|系统分类:人文社科| 信息, 对数透视原理, 网络环境

网络环境下的对数透视原理

肖楠 任全娥 胡凤(发表于《图书情报知识》2007年第3期)

    文章在分析网络环境对对数透视原理产生的深远影响的基础上,具体就网络环境下知识增长的对数透视、知识获取的时间对数转换、检索效率的对数透视、空间和学科(领域)的对数透视进行了探讨,认为对数透视原理在网络环境下仍然具有普适性,同时也有新的表现形式和发展趋势。

关键词  对数透视原理  网络环境  知识  信息

A Study on the Principle of Logarithmic Perspective under Network Environment

 

 

Abstract   The paper discusses the network environment press an important influence on the principle of logarithmic perspective. Then the paper probes into logarithmic perspective of knowledge increasing, time logarithmic perspective of knowledge obtaining, search efficiency logarithmic perspective, space and subject (field) logarithmic perspective. Base on the analysis above, the authors believe that the principle of logarithmic perspective is still a common principle under network environment, but it has new representation and development.

Key Words  Principle of logarithmic perspective; Network environment; Knowledge; Information

 

1        对数透视理论

对数透视原理是情报学的基本理论之一,是指人类获取和接受信息、知识、情报的认知过程遵循对数转换机制[1]。对数透视原理实质上源于实验心理学中的韦伯-费希纳定律,在上世纪80年代,英国著名情报学家B.C布鲁克斯在阐述人的知识、信息获取过程时,深入研究了感觉信息的接收过程,并将透视原理──对象的观察长度Z与从观察者到被观察对象之间的物理距离X成反比,引入情报学,并提出了 Z=LogX的对数假说,在一定程度上较好地说明了知识、信息传递中随时间、空间、学科(领域)的不同而呈现的对数变换[2]归纳起来,对数透视原理是解释人们遵循最省力原则进行信息、知识、情报的获取和吸收。具体而言,指在时间上寻求最新,在空间上寻求最近,在学科(领域)上寻求从自己最善长和最熟悉的领域获得知识、信息。

从上述的阐释中,我们不难发现布鲁克斯提出的对数透视原理是建立在若干个假设的基础之上的,归纳起来有以下几点:(1)宏观上信息空间密度均匀,微观上每篇文献包含的知识、信息量相等。(2)知识、信息获取者的接受能力相同。(3)知识、信息的获取没有其他辅助工具或技术的支持。(4)知识的继承性很好。虽然这些都是基于现实的信息环境提出的假设,但对数透视原理在解释人认识信息世界的现象和问题时仍然具有一定的客观性,而且随着信息环境的改变,对数透视原理会有新的表现形式和发展趋势。基于此,本文试图分析对数透视原理在网络环境中新的表现和发展。

互联网的出现和迅速发展显然改变了人类信息交流的方式,在网络信息量的急剧增长、资源的迅速数字化、信息检索的便捷高效、信息交流的不断创新、信息显示形式的多样化和知识信息共享条件不断成熟等的影响下,信息环境(资源环境、技术环境、人的信息接受力等)相应发生了变化,利用网络信息技术在网络环境里获取信息、知识、情报成为一种普遍的形式。在这样的背景下,对数透视原理将会有新的表现形式和发展趋势,这些新的表现和发展同样体现在人们获取和接受信息、知识、情报的认知过程中。

2        网络环境下对数透视原理的新表现

2.1 知识增长的对数透视

“信息爆炸”已成为网络时代的专门术语,指随着经济社会和科学技术的发展,特别是互联网的出现和迅速发展,促使了信息的爆炸式增长。那么,是否知识也如信息一样爆炸式增长呢?布鲁克斯曾用对数透视效应来描述文献与其所含的知识内容之间的量的关系,认为文献数量增加量对数转换后才可以表示知识的增加量[2],文献数量的指数增长,经过转换后,知识是直线增长的态势,比文献增长慢得多。

在网络环境下,网络文献对数转换后是否符合上述规律呢?为此我们做了一个简单的验证,在搜索引擎AltaVista中以“project management”为关键词,从19991月到20061月,逐年进行检索(检索时间是2006128),对页面数量(pn)和页面数量的对数(logpn))统计如表1(由于在透视法的世界,不存在任何客观尺度,只存在某种比例,因此底可以任意选择[3],为方便运算,在本文的数据处理中对数的底取10)。

1  页面数量和页面数量的对数分时间段统计表

标号(time

时间段(t

相关页面数量(pn)

Log(pn)

1

1999.1-2000.1

670000

5.83

2

2000.1-2001.1

1030000

6.01

3

2001.1-2002.1

1710000

6.23

4

2002.1-2003.1

2550000

6.41

5

2003.1-2004.1

4110000

6.61

6

2004.1-2005.1

6180000

6.79

7

2005.1-2006.1

10200000

7.01

把上表中相关页面数量和时间(以标号代表时间段,下同),以及相关页面数量的对数和时间为参数,在SPSS中进行拟合分析,得到页面数量的增长拟合普赖斯增长曲线(如图1),页面数量对数转换后其增长拟合一元线性方程(如图2)。


1  pntime的指数拟合曲线              2  Logpn)与time的直线拟合

如果以页面数量代表信息量,那么网络环境下信息量是指数增长的,而应用对数透视原理来对指数增长的信息量进行分析,可以认为知识的增长和积累是相对稳定的。对于这个个案而言,项目管理从上世纪九十年代末发展到现在,相关知识的增长是比较符合线性增长趋势。

网络文献能从什么程度上度量知识,这是一个十分复杂的问题,但不可否认网络环境和网络技术极大地方便了知识、信息的传播、获取和利用,对知识的积累起到了非常大的促进作用,但据此并不能促使知识的爆炸式增长,因为知识的增长仍然有一个量变到质变的过程,知识的迅速增长一般是在学科理论重大突破后,相关新思想、新成果、新方法的产生[4],其关键因素是人的创造性劳动成果,而网络环境只是在一定程度上给人的创造性劳动提供条件,并不能直接导致创造性劳动成果的产生。综上所述,在网络环境下即使信息量急剧指数增长,知识仍是线性增长和积累,是对数透视原理在网络环境下的体现。

2.2知识获取的时间对数转换

在网络环境下,信息的产生和传播非常便捷,同时也更易于被其他用户获取,从而知识、信息获取的喜新厌旧也就会更加明显,这个可以从门户网站上信息的更新率上得到体现,因为那几乎是一种实时更新,目的是要满足用户对新信息的强烈需求。

由于在网络环境中,信息交流、获取和利用是不规范的,所以可以从中文社会科学引文索引数据库CSSCI中调查论文的被引情况来近似解释这个现象,理由是:(1)目前,科研工作者已经习惯使用网络直接获取或者通过网络从学术数据库中获取知识、信息。2)对他人文章的引用可以认为是一种知识获取行为。基于此,我们从CSSCI的引文库中对2001-2005年的所有文献的引用总体数量逐年进行了统计,如表2所示,其中表格中的数据表示当年(横排中的年份)发表的所有文献引用其前某年(竖排中的年份)的文献的次数。

2  2001-2005CSSCI引文库引用次数逐年统计表

被引

引用

2000

2001

2002

2003

2004

2001

24113

 

 

 

 

2002

27029

28086

 

 

 

2003

26366

32621

35554

 

 

2004

26726

32937

40905

39492

 

2005

27966

32307

39961

47134

47431

由于对相关文献的引用次数的影响因素很多,如文献逐年增多、特定的研究课题、用户的喜好等,在此仅从时间对数透视的角度对用户偏好新文献的现象进行初步分析。从横排看,可以发现引用数量逐年递增,例如2005年的全部文献中引用2004年的文献次数最多为47431,对2003200220012000的引用次数逐年递减,对2000年的引用最少为27966,对其他年份分析亦如此(2004年对2003的引用次数少于对2002年的引用次数,但相差无几,故认为符合总趋势),说明用户在获取知识过程中对新知识的偏好倾向。从对角斜线看,亦是一个逐年递增的过程,如2005年引用2004年文献的次数多于20042003文献的引用次数, 2004年引用2003年文献的次数多于20032002文献的引用次数,这说明我国科技在迅速发展过程中,科研工作者对于最新知识的偏爱越来越强烈。

可以用对数透视原理来解释人们对知识的喜新厌旧,时间对数透视揭示了人们对不同时间段的知识、信息的认知的主观感受是不同的,也即对新知识的偏爱,这种偏爱是因为用户对于近期信息所给予的重要性评估要比对早期信息所给予的重要性评估要高[5],从而导致知识、信息获取行为中对新知识、信息的偏好。从上分析可知,知识获取的时间对数透视在网络环境中仍然是普遍存在的。

2.3检索效率的对数透视

网络环境下,用户可以获得全世界任何角落的信息,但如何在这样一个信息海洋中得到自己需要的知识、信息就需要借助一个高效的搜索工具,如搜索引擎。使用搜索引擎,必然就有一个从用户角度对其进行评价的问题,对于用户的检索,搜索引擎往往会提供数以万计的结果供用户筛选,而用户往往只关注检索结果集中排在前面的几条或者几十条,同时应该看到很多用户认为这几条或者几十条已经基本满足了需求,而不会把所有的检索结果浏览一遍。查全率是检索效率的一个重要指标,指检索出的相关文献与检索系统的全部相关文献之比,由于我们无法确定检索系统中与检索主题相关的文献数量,也无法确定检索出来的真正相关文献的数量,所以可以把检索出来的记录数量看作检索系统中全部相关文献数量,同时把用户选择的记录数看作检索出的相关文献,这样检索结果集中用户选择的记录数相对于检索出的所有记录数的比值就是一种从用户角度分析的查全率,以此对搜索引擎的检索效率进行分析,能更好表达用户真正获得的知识、信息,但如果在海量检索结果的情况下,上述查全率就很小,显然不符合事实,因此可以从对数透视原理的角度对其进行考察。

可以用模拟的方式进行对比研究,设Ps为搜索引擎检索出的结果数,初设为100p为用户实际选择的检索结果数,则用户角度分析的查全率公式为p/Ps,以对数透视原理为出发点进行认识,查全率则是一个从知识集合中选择自己需要的知识的选择过程,存在一个客观到主观的对数转换过程,也即是对pPs取对数后的比值,即log(p)/log(Ps)。取p10752分别用进行模拟,结果如表3

3  用户角度的查全率与对数转换后的查全率的对比

p

用户角度的查全率  p/Ps

对数转换后的查全率  log(p)/log(Ps)

10

10%

50%

7

7%

42%

5

5%

35%

2

2%

15%

从以上的模拟数据可以看出,依据对数透视原理,用户即使只选择了结果集100条中的10条记录,其检全率仍然达到50%,而不是10%,更进一步解释为10条记录可以满足用户的50%的知识需求。这是因为知识是有继承性的,同一主题的不同文献包含的知识必定有重复,对于同一类知识,用户的吸收过程是边际递减的,也就是说即使用户再选择10条记录,也只能得到其中的小部分知识,因为很大一部分在前面选择的十条中已经包括了。

对此仍然有一个问题,如我们用AltaVista并用关键词“project management”来对2005.1-2006.1间的记录进行检索,得到10200000条记录,我们仍用对数透视原理对其进行检索效率分析,例如选择30条得到查全率为21%,选择10条得到查全率为14%,这就与我们感觉的前几十条满足大部分知识需求相差较远。

这主要是我们假定了搜索引擎检索的结果集中每条信息含有的知识、信息量是相等的,且我们自身不对信息进行筛选而是随机选择。其实在互连网上每条信息中含有的知识、信息量是有很大差别的,而搜索引擎根据一定的算法可以在一定程度上实现结果记录的合理排序,并将与用户需求最相关的信息排在前面,加之我们自身对信息的筛选能力,所以我们选择的一般是优化的,而不是随机的。同时,网络上大量的重复信息、无用信息甚至无关信息也被搜索引擎检索出来,使得检索的结果集非常庞大。这些因素就使得即使用对数透视计算公式来转换仍然会有差别,但是用对数透视原理来解释海量的信息和有限的知识仍非常有用,就如同我们使用搜索引擎并不太关注其提供的结果集有多大,而关注结果集中排在最前面的记录是否能很好满足我们的知识需求。

2.4空间和学科(领域)对数透视

传统的对数透视原理解释了人们在获取知识的时候遵循省力原则,会选择物理空间近的信息或者信息栈比较少的信息,并在自己最熟悉的学科(领域)获取知识、信息。

网络环境下,世界被网络连为一体,在网络上获取知识和信息就突破了物理空间的限制,从而变得越发简易。从信息栈的角度考察,由于超级链接的广泛应用,如果仍以顺序点击获取信息,也会形成非常多的信息栈,但随着技术的进步,特别是搜索引擎技术的不断成熟,需要经过多栈才可以获取的信息变成直接就可以获取,所以在网络环境下,信息栈对于知识、信息获取的影响也越来越小。同时,随着信息技术的不断成熟,信息推送、个性化服务、知识导航、信息可视化等新技术和服务的出现和广泛应用,使计算机程序参与到我们获取知识、信息的全过程中,提高了知识、信息获取和吸收的效率。基于此,我们认为网络环境下用户对知识、信息的获取仍遵从省力原则,而这种省力是借助网络信息技术实现的,是对传统物理空间或者信息栈中知识、信息获取对数透视的发展。

在学科(领域)或者知识空间的对数透视研究中,一般从学科、知识相关性的统计数据中得出规律[6]。如研究论文[7]1989年对16种情报学类期刊的引文进行了统计分析,发现情报学研究人员在获取信息时,66.76%来自学科本身,其次18.5%来自关系最密切的图书馆学,其他近48个学科只占了14.7[8]。这是学科(领域)对数透视的表现,也即从最熟悉的学科(领域)获取知识、信息。从时间维度分析,可以认为当时网络环境对知识、信息获取的影响不大,但近年来网络的迅速发展,学术研究已普遍从网上直接获取或者通过网络从学术数据库中获取知识、信息,并且很多学术数据库不只是收录一个学科的文献信息而往往是多学科的文献一同收录,加之学术数据库提供的关键词查询很容易将其他学科相关的信息检索出来,从而导致了在网络环境中获取知识、信息的方便性和多学科性,相应学科(领域)对数透视也会有新的表现。基于此,我们从我国情报学领域2006发表的文献中随机抽取了10篇文献,对其引文进行了初步分析,如表4(由于有些引文只是一个网址,无法确定其语种和学科属性,故将有语种和学科可知性的引文数作为统计项目)。

4  2006年图书情报学领域随机10篇文献的引文分析

总计引用文献数

直接引自互联网的引文数

语种、学科可知的引文数

中文引文数/英文引文数

属于图书情报学的引文数

属于其他学科的引文数

72

25

61

48/13

26

35

从表4的统计可以看出,网络环境下情报学领域研究人员获取知识、信息时,引用图书情报学本学科领域论文有42.6%,对其他学科引用达到52.4%,外文文献引用达21.4%,总的应用文献中有34.7%直接来自互联网。从这一个少量的抽样分析,我们可大致看出网络环境下学科(领域)知识、信息获取的多学科特点,以及借助网络获取或者直接从网上获取的发展趋势,是学科(领域)对数透视在网络环境下的新发展。

3        结论

对数透视原理揭示的人类获取和接受信息、知识、情报的认知过程遵循对数转换机制在网络环境下仍然具有普适性。同时,网络环境中新的信息交流、获取、处理手段,使得对数透视原理在网络环境中有新的表现和发展。通过对数透视原理,可以使得我们更好地从客观和主观两方面认识网络环境中的信息现象。

 

参考文献

1马费成. 情报学基本理论研究. 课堂笔记. 2006

23 B.C Brookes(王崇德等译). 情报学的基础(三). 情报科学.1983(6)84-91

4马费成. 论布鲁克斯情报学的定量方法.情报科学. 1983(4)1-9

568 严怡民. 现代情报学理论. 武汉:武汉大学出版社.1996. 134-150

7施利军. 关于情报学相关学科的定量研究.情报业务研究. 19915 (2)98-100



https://blog.sciencenet.cn/blog-298986-254273.html

上一篇:《育儿日记》三篇
下一篇:知识管理对图书馆虚拟参考咨询服务的理论阐释
收藏 IP: .*| 热度|

1 赵星

发表评论 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 00:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部