||
数字化进程中,文本的地位没有下降
武夷山
加大戴维斯分校传播学系的Martin Hilbert在The Information Society杂志2014年第2期发表文章,What Is the Content of the World’s Technologically Mediated Information and Communication Capacity: How Much Text, Image, Audio, and Video? 文章提出的问题是,数字化进程是否改变了世界上被传播和存储的信息总量中文本、图像、音频和视频的份额。
作者对1986-2007年的数据作了定量分析,有两个意外发现。
首先,在宏观层次上,信息容量的演变具有强烈的“惯性”。例如,尽管我们的信息载体从唱片、录像带、录音磁带转变为CD盘和硬盘,但信息容量的分布几乎不变。例如,1986年模拟音频信息和视频信息分别占总量的14%和58%,但20年后,数字化主导的音频信息和视频信息的比例只不过变化为15%和53%,变化量很小。
其次,最出乎意料的,在数字时代,文本(字母+数字)内容的份额反而比模拟时代还要大。直觉上会以为,随着带宽和存储能力的增大,多媒体内容会迅猛增加。但是,在向数字化进军的过程中,原有文本模拟信息数字化(例如,将纸本论文扫描为PDF文件)的数量或是数字化信息的生产量(比如我们写博客,都是在生产数字化信息)更大(例如在1986年,数字化文本信息只占数字信息传播总量的0.3%,而2007年占到了接近30%),导致其所占份额反而增大了。
数字化文本数据的绝对量和相对份额都在增加,这就给大数据分析师提供了良机。现在的主要问题不是“巧妇难为无米之炊”,而是你是否具备从大数据(生米)中挖掘出情报(熟饭)的技巧。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 20:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社