|
摘要:信息源失真是最本质的信息失真。本文在界定数据和信息内涵的基础上,分析了信息的形成过程,构建了信息的处理机制。探讨了信息源失真的原因:认为在数据搜集阶段,数据搜集工具、处理者认知能力、调查对象的主观故意、沟通障碍会影响数据的准确与全面;在数据处理阶段,数据处理方法工具不当、处理者知识积累偏误及生理心理因素会影响数据处理结果;信息把关人也会故意传播虚假信息。最后提出了解决信息源失真的方法和思路,有些信息源失真也许根本就没有很好的解决办法,需要信息接受者仔细鉴别。
关键词:数据 信息 信息源 信息失真
中图分类号:G20
在新世纪之初,人类正走进以信息技术为核心的知识经济时代。材料、能源、信息是人类的三大资源。分析数据处理与信息的形成过程,有利于从信息源角度分析信息失真的原因,采取措施对其进行相应的控制,减少信息失真,从而进一步优化信息资源配置,加快知识传播和创新,从根本上促进经济增长方式的改变,使社会和谐可持续发展。
一、数据和信息的界定
信息的定义是如此之多,至今为止也没有一个公认的概念。信息论的创始人申农(1948)[1]在研究广义通信系统理论时把信息定义为信源的不确定度。控制论的奠基人维纳(1948) [2]指出:“信息就是信息,不是物质,也不是能量”,专门指出了信息是区别于物质与能量的第三类资源。R.卡纳普(1964)[3]提出语义信息,语义不仅与所用的语法和语句结构有关,而且与信宿对于所用符号的主观感知有关,语义信息是一种主观信息。80年代哲学家们提出广义信息,认为信息是直接或间接描述客观世界的,把信息作为与物质并列的范畴纳入哲学体系。郑丽航、余秋英[4](2002)认为应建立信息行为的社会控制体系,并提出了相关政策建议。
不同学科由于研究对象不同,对信息的定义可以不同。从社会学以及信息和人类关系的角度,俞立平(2006)[5]将信息定义为:信息是对人们有用的数据及其处理结果。数据是对主客观事物的某些特征及其相互联系的一种抽象化、符号化表示。数据是主观客观世界的反映,数据本身并不是信息,数据成为信息的前提有两个,或者是数据本身直接有用,或者数据经过加工处理后变成有用的结果。信息既是主观的,也是客观的,是对数据进行进一步加工处理的结果,因此,相同的数据,不同的人、不同的处理方法可以得出不同的信息。
国内外学者在信息的形成机制上缺乏系统研究,只有零星报道。在信息失真问题上,主要集中在信息传播和存储领域的失真,没有从信息源的角度进行深入分析,研究也不够深入。本文从信息的形成过程、数据处理机制角度出发,分析信息失真的原因,进而提出控制方法。
二、信息的形成过程
信息来源于数据,这里引入数据源的概念,所谓数据源,就是可能给人类社会带来数据的所有对象。如果说信息是产品,数据源相当于原材料。数据源不仅仅包括客观世界,也包括主观世界,前者主要是自然科学研究的对象,后者主要是社会科学研究的对象。主观世界许多内容都是数据源,比如,人们对某个问题的看法、信仰、爱好等等。
从数据源产生的数据经过数据处理后,就变成了信息。这里需要说明的是,从信息的形成角度看,有两种信息,一类信息称为数据信息,其内容就是数据本身,但是这种数据成为信息的前提条件必须经过信息处理者的分析,也许这个过程非常简单快捷,比如沙漠的旅行者发现水源。另一类是加工信息,是对数据进行复杂加工的结果,形式上与原有数据存在差异。这里,数据处理是广义的概念,数据信息经过大脑思维被确定为信息本质上也是数据处理过程。
数据处理结束后存在一个反馈过程,如果处理结果与预想的有出入,或者得到的信息本身非常重要,数据处理者有可能会重新核对数据。
信息形成后,由信息把关人决定信息是传播、存储和废弃,从理性人的角度出发,信息把关人会选择相应的信息流向。需要说明的是,数据搜集人、信息处理人、信息把关人可能是同一人,也可能是不同人。既可以是个人,也可以是组织,如企业、政府、网站、图书馆、报刊杂志社等等。信息的形成过程见图1。
数据源 数 据 数据处理 客观世界 主观世界 信息 信息把关人 传播 存储 废弃 数据信息
图1 信息的形成过程
三、数据的处理机制
下面分析数据的处理机制,数据源的数据有两种传播方式,第一种方式主动传播给数据接受者,数据接受者接受数据的前提条件是该数据必须能够引起他的“注意”,数据接受者每天都有可能接触到大量的数据,但能够被他接受到的很少,这很少的一部分数据才有可能经过进一步加工变成信息。第二种是数据接受者主动搜集数据,数据接受者根据需要会主动进行数据的搜集。
数据接受者收到数据后,会对其进行处理,数据处理受四个因素的影响,第一是处理者偏好,这纯粹是处理者的主观因素,不同处理者偏好不同,但总体上受当时社会意识形态、道德、法律、生理心理等因素的制约。第二是知识积累,处理者的知识积累会影响数据处理甚至数据搜集。第三是处理工具和方法,处理工作和方法会影响处理的效率和效果。有时,处理工具和方法起决定性的作用,人的大脑是重要的数据处理工具之一。第四是相关信息情况。
由于数据接受者、数据处理者的能动作用,导致对同一数据处理后产生不同信息。数据的处理机制见图2。
数据处理(者) 数据源 知识积累 相关信息 信息 处理工具方法 主动传播 主动搜集 数据接受者 处理者偏好
图2 数据处理机制
四、信息源失真的原因分析
从数据处理机制与信息的形成过程可以进一步分析信息源失真的原因。数据源包括客观世界和主观世界,客观世界的数据总是真实的,但由于人们的认知能力有限和知识积累问题,加上数据搜集工具的限制,甚至还有生理心理因素的影响,有些数据会取得精确结果,而大部分数据会存在误差,甚至错误。比如观测工具自身误差、人眼的错觉、看问题的深度等因素都会造成误差甚至错误。需要说明的是,误差只要在许可范围内,是不影响数据处理的。真正可能带来问题的超过许可范围的较大的观测错误,有些是根本性的系统错误。
主观世界的数据既包括真实数据,也包括虚假数据。虚假数据形成的原因有两个,一是主观数据源故意造假,受心理因素、环境压力、自我保护、个人隐私等多种因素的影响。二是信息搜集者与被搜集者之间沟通障碍,由于对语义的理解、概念的界定存在差异,导致误差。
数据处理阶段也存在失真因素,一是数据处理工具方法的错误,会严重影响数据处理结果,主要问题在于现有数据不符合采用该数据处理工具方法的条件,当然也存在即使符合条件,但使用不当问题。二是数据处理者知识积累偏误,导致处理分析出现偏差,如忽视数据、数据不全、原因错误等等。三是数据处理者的生理心理因素的影响,因为数据处理者既可以是个人,也可以是组织,但本质上都是由人对数据进行加工处理的。
数据处理结束后变成了信息,此时仍然存在重大失真的可能性,就是信息把关人为了自己利益最大化,故意歪曲信息,传播虚假信息,而将真实信息保存,为自己所用,典型的是军事情报信息、市场竞争情报信息等。
从以上分析可以看出,在数据搜集、数据处理、把关人三阶段都存在主客观的数据或信息失真因素。信息失真原因分析见图3,粗体字表示失真原因。
数据源 数据处理 客观世界 主观世界 结果信息 真实数据 虚假数据 偏误数据 精确数据 工具方法偏误 主观故意 知识积累偏误 把关人 造假信息 信息源 沟通障碍 生理心理因素
信息源失真是最根本的失真,从而导致信息失真。一般而言,信息失真会导致社会资源的浪费,因为大部分信息都是要影响人类的决策,从而带来行动的。防止信息失真,必须从信息的形成阶段入手。
在数据搜集阶段,为了减少客观世界数据的偏差,一是加强学习,提高信息搜集者的知识积累。二是可能的话,采用先进的数据采集手段,减少人为偏差。对于主观世界调查对象故意制造虚假数据情况,要分析原因,采取各种措施力求准确反映实际情况,如尽量减轻数据调查中调查对象的心里压力,采取匿名方式,配合必要的物质刺激,营造良好的调查气氛等等。另外调查时要注意语义准确,不能有歧义的情况发生,以防止沟通障碍。此外,还可以采取一些技术手段防止主观世界数据不准确问题,如特殊情况下测谎仪的使用等等。
在数据处理阶段,要加强知识积累,同时要充分了解数据处理方法和工具适用范围,避免数据处理方法和工具的错误适用。有条件的话要选用有经验的人来分析处理数据。同时要注意信息处理者生理心理因素的影响,如不要过分疲劳,力求客观公正等等。
在信息把关人阶段,如果把关人故意传播虚假信息,这几乎是无法解决的,因为对其本身而言,他对信息是清楚的。只能等信息传播以后,信息接受者加强分析处理,去伪存真。
六、结论
人类的生活离不开信息,在信息形成阶段,如果说导致信息失真的客观因素还是相对的容易解决的话,那么导致信息失真的主观因素是很难解决的,也许根本就没有较好的解决办法。这就加重了信息传播后信息接受者的负担,需要对信息进行进一步审计,要付出一定的代价,甚至会带来资源浪费。对于信息接受者而言,如果信息比较重要,一般都会对信息进行审计与核实,这有利于保证信息的准确性,不同的信息部门的存在虽然会造成信息冗余,但可以降低信息审计与核实的难度,因此其存在具有一定的合理性。
参考文献
[1] C. E. Shannon, A mathematical theory of communication, Bell System Technical Journal, vol. 27, pp. 379-423 and 623-656, July and October, 1948.
[2] N.Wiener, Cybernetics: or Control and Communication in the Animal and the Machine, Cambridge, MA: The MIT Press,1948:127-145
[3] R. CARNAP, Meaning and Necessity. A Study in Semantics and Modal Logic, Chicago :Univ. of Chicago Press, 1964:47-58
[4]郑丽航,余秋英.信息行为的社会控制体系初探[J].情报科学,2002(9):910~912
[5] 俞立平. 信息资源的内涵及其传播、处理对经济增长的作用机制研究[J]. 图书情报工作,2006(3):43-45
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-10 07:55
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社