武夷山分享 http://blog.sciencenet.cn/u/Wuyishan 中国科学技术发展战略研究院研究员;南京大学信息管理系博导

博文

数字化进程中,文本的地位没有下降 精选

已有 5992 次阅读 2014-6-9 06:34 |个人分类:图书情报学研究|系统分类:观点评述

数字化进程中,文本的地位没有下降

武夷山

 

加大戴维斯分校传播学系的Martin HilbertThe Information Society杂志2014年第2期发表文章,What Is the Content of the World’s Technologically Mediated Information and Communication Capacity: How Much Text, Image, Audio, and Video? 文章提出的问题是,数字化进程是否改变了世界上被传播和存储的信息总量中文本、图像、音频和视频的份额。

作者对19862007年的数据作了定量分析,有两个意外发现。

首先,在宏观层次上,信息容量的演变具有强烈的“惯性”。例如,尽管我们的信息载体从唱片、录像带、录音磁带转变为CD盘和硬盘,但信息容量的分布几乎不变。例如,1986年模拟音频信息和视频信息分别占总量的14%和58%,但20年后,数字化主导的音频信息和视频信息的比例只不过变化为15%和53%,变化量很小。

其次,最出乎意料的,在数字时代,文本(字母+数字)内容的份额反而比模拟时代还要大。直觉上会以为,随着带宽和存储能力的增大,多媒体内容会迅猛增加。但是,在向数字化进军的过程中,原有文本模拟信息数字化(例如,将纸本论文扫描为PDF文件)的数量或是数字化信息的生产量(比如我们写博客,都是在生产数字化信息)更大(例如在1986年,数字化文本信息只占数字信息传播总量的0.3%,而2007年占到了接近30%),导致其所占份额反而增大了。

数字化文本数据的绝对量和相对份额都在增加,这就给大数据分析师提供了良机。现在的主要问题不是“巧妇难为无米之炊”,而是你是否具备从大数据(生米)中挖掘出情报(熟饭)的技巧。




https://blog.sciencenet.cn/blog-1557-801731.html

上一篇:追悼麦戈文先生
下一篇:出差期间暂停更新博客
收藏 IP: 219.142.242.*| 热度|

30 许培扬 钟炳 曹聪 陈小润 张骥 李伟钢 刘伟 罗汉江 李泳 王桂颖 孙学军 赵斌 王启云 赵凤光 鲍海飞 袁江洋 赵美娣 孟庆勋 刘庆宽 文克玲 彭真明 肖振亚 余党会 陈筝 韩枫 孙小淳 闫钟峰 shenlu cyliugz xqhuang

该博文允许注册用户评论 请点击登录 评论 (13 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 20:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部