姜咏江
谈过什么是信息和信息如何用数学方法度量之后,我们来谈谈为什么要对信息计量。
世界上一切事物的计量都是为了用。除了有特殊的用途之外,信息的计量主要是为了公平的交换。在商品市场上,交换的基础首先是数量,其次才是价格,没有数量,就失去了价格的意义。
最典型的,也可以说是“公平”的信息计量,是体现在文字信息上,这也许在信息科学家没有研究之前,人们已经学会了如何度量信息了。计量文字信息量的方法,就是数文字的个数。不论哪一个有文字的民族都是以这种简单的方式对文字信息进行计量的。用文字的数量作为付给作者报酬的标准。用文字数量来确定图书的价格。这一切都显得那么自然,合情合理。用文字来描述事物的人,他们在从事“信息处理”的工作,并在工作中,付出了艰辛的劳动。他们将各种各样的信息搜集起来,然后又转化成用文字描述的形式,这其中需要功底和技巧,就如同我们要将各种各样的信息,进行数字化一样,绝非易事。
一切事物都可以都可以用语言文字来描述,因而一切信息都可以转化成文字信息。由此来看,信息量的问题并不是什么新的发明,而是有文字的历史以来,人们就已经掌握了的问题。用二进制数字来表达信息,应该说是人类的结构最简单的一种文字信息,可以叫“万国通用文字”信息,数码“0”“1”就是其中最基本的文字。0或1在万国通用文字描述中的数量就是信息量!
一个语言文字所占的位置就是一个“bit”,只是由于语言文字之间没有进位关系,故而不能用数学算式来表达一个信息的位数多少。而用数字描述信息x,就能够做到用数学计算的方法,得到数码的位数log2x。
信息的计量都是在某种公认的“一致性”基础上进行的。就文字描述事物来说,事物的描述可以是“精准”的,即言简意赅。这种情况下,使用文字的数量会相对少。对同一事物的描述,也可能是“罗嗦”的,那么所用的文字就会较多。在这两种情况下,似乎是以文字数量来计算信息量又不够精确了。其实任何一种计量方法都有误差,只要我们不“计较”那些“无关紧要”的误差,一切不就都变得“精确”了吗?
任何事物抽象到数值化的过程,都会有舍弃误差的过程,从这种情况来看1≠1,只有当我们对实际误差不计较的时候,才是纯数学的1=1。
最后要说,用概率方法计算信息量,不仅因为随机的概率不容易确定,而更重要的是失去了“公认的”一致性,因而在实践中很难应用于信息交换。
呵,科学,你要简单还是复杂?
2010-1-25
https://blog.sciencenet.cn/blog-340399-290043.html
上一篇:
香农的信息度量方式实用吗下一篇:
原理是创新设计的前提