tianrong1945的个人博客分享 http://blog.sciencenet.cn/u/tianrong1945

博文

科学方法论--老鼠、毒药、信息论、称球 精选

已有 8595 次阅读 2013-3-8 09:37 |系统分类:科普集锦| 科研, 信息论, 数学题, 称球, 老鼠毒药问题

我在上一篇帖子“大将军数学题2-答案中”,出了一道有关用老鼠检测毒药瓶的附加题:

100只一模一样的瓶子,编号1-100。其中99瓶是水,一瓶是看起来像水的毒药。只要老鼠喝下一小口毒药,一天后则死亡。现在,你有7只老鼠和一天的时间,如何检验出哪个号码瓶子里是毒药?

这儿把它叫做‘问题1’,解决此题的方法可谓二进制应用的经典:

首先,将瓶子的10进制编号数改成7位的2进制码。然后,让第1只老鼠喝所有2进制码第1位是1的瓶子中的水;让第2只老鼠喝所有2进制码第2位是1的瓶子中的水;以此类推下去。这样,每个老鼠第二天的死活情况就决定了毒水瓶子二进制码这一位的数字:老鼠死,对应1,反之为0。换言之,将7只老鼠死活情况排成一排。比如说结果是“死活死死活活死”的话,毒水瓶子的二进制标签就是:1011001,转换成10进制,得到89

 

这道题可以有很多种在各个参数方向的扩张和一般化。最“通---通”的解够你研究好一阵子。比如,如果我们把题目稍加变化(问题2):

100只一模一样的瓶子,编号1-100。其中99瓶是水,一瓶是看起来像水的毒药。只要老鼠喝下一小口毒药,一天后则死亡。现在,给你2天的时间,请你告诉我,你至少需要多少只老鼠,才能检验出哪个号码瓶子里是毒药?

比较原来的题目,这个题目有两个变化:一是给你的时间多了一天。因为老鼠喝毒药1天之后死去,2天意味着你可以做两次实验,这给了你一个时间方向(实验次数)的空间,有可能让你用更少数目的老鼠,达到同样的目的。

第二个改变是提问的方式。这次的问题是:你‘至少’需要多少只老鼠?回答这类问题,是只要估计一个下限,对你来说,做实验的小白鼠多多益善,但你的老板要花钱买它们,他得考虑经济效益。当你还没有完全把方案想清楚之前,你好歹给老板一个交代呀。这种时候,信息论能派得上一点用场。

刚才我说‘信息论’,实际上,我们完全用不上什么信息论的任何高深理论,用的只不过是由香农定义的计算信息量的一个公式而已。牛刀杀鸡虽然太大,但用它锋利的小尖给开个小口也未尝不可。

不仅仅是这道题,还有几星期前科学网讨论热烈的“称球问题”,都是能用此‘牛刀’而有所受益的。实际上,我认为,许多问题的解决,都能和这‘牛刀’沾上边。如果从‘信息’的角度来分析某些问题,可以使你更登高望远,对问题能有更深层的理解,更容易融合各学科的间隙,达到借他山之石而攻玉的效果。

科学(不仅限于数学)上的大多数研究,说穿了就是一个处理‘信息’的过程。摈弃无用的信息,想办法得到有用而正确的信息,用以消除原来课题中的不确定性,得到更为确定的科学规律。

那么,我们首先要明白,什么是信息?

这是一个古老的问题,又是一个现代的问题,也是一个迄今为止仍然总说纷纭、悬而未决的问题,特别是在社会所认可的广义信息的层面上。

你要是问:“什么是信息?”,人人都能列出一大串他称之为‘信息’的东西:新闻、消息、音乐、图片……。然而如果问:“信息是什么?”那就难以回答了。因为你可以说:“音乐是信息”,但你不能说:“信息是音乐”;你可以说:“照片是信息”,但你不能说:“信息是照片”。要给信息下个定义是不容易的。‘信息’的定义需要从许多具体信息表现形式中抽象出它们的共性来。

中国古人理解的信息其实很简单,正如李清照的名句中所述:“不乞隋珠与和璧,只乞乡关新信息。”,看来这只是通俗意义上的‘音讯’或‘消息’而已。

现代人比较考究,注重科学。因此而成天琢磨:信息到底是什么?信息是主观的还是客观的?是相对的还是绝对的?

昨天北京发大水,你将这个消息,用电话告知你南京的两个朋友,可是,A说他早知此事,B原来不知晓,因此,这条消息对A来说,没有增加任何信息,对B来说就增加了信息。B抱着的小狗好像也听见了电话中的声音,但它不懂人的语言,这对它来说也不是信息。

信息是模糊的还是精确的?

你走到树林里,艳阳高照、和风习习、桃红李白、燕飞鸟鸣,大自然传递给我们许多信息,这些算是没有精确度量过的、模糊的信息。

信息和‘知识’是一码事吗?也应该不是。众所周知,我们的信息化社会虽然充满了信息,但其中“鱼龙混杂,良莠不齐”,以至于大家都希望自己的孩子不要整天沉迷于网上,许多人抱怨:“信息虽发达,知识却贫乏”。所以,信息并不等同于知识!

文学家、哲学家、社会学家……,各家各派都对‘信息’ 有不同的理解和说法。这其中,物理学家们,是如何理解和定义信息的呢?

物理学家们的研究对象是物质和物质的运动,即物质和能量。在他们看来,信息是什么呢?是否能归类进这两个他们所熟悉的概念呢?

信息显然不是物质,它应该是物质的一种属性,听起来和能量有些类似,但它显然也不是能量。物理学中的能量早就有其精确的、可度量的定义,它衡量的是物体(物质)做功的本领。信息与这种‘功’似乎无直接关联。当然,我们又知道,信息是很有用的,个人和社会都可以利用信息来产生价值,这不又有点类似于‘做功’了吗?对此,物理学家仍然摇头:不一样啊,你说的好像是精神上的价值。

信息属于精神范畴吗?那也不对啊,从科学家们的眼中看来,信息,仍然应该是一种独立于人类的主观精神世界、客观存在的东西。因此,到了最后,有人便宣称说:

“组成我们的客观世界,有三大基本要素:除了物质和能量之外,还有信息。”

美国学者、哈佛大学的欧廷格(AGOettinger)对这三大基本要素作了精辟的诠释:

“没有物质什么都不存在,没有能量什么都不会发生,没有信息什么都没有意义。”

尽管对“信息是什么?”的问题难有定论,但通过与物理学中定义的物质和能量相类比,科学家们恍然大悟:信息的概念如此混乱,可能是因为我们没有给它一个定量的描述。科学理论需要物理量的量化,量化后才能建立数学模型。如果我们能将‘信息’量化,问题可能就会好办多了!

于是,在二十世纪40年代后期,一个年轻的科学家,后来被人誉为信息和数字通讯之父的香农,登上了科学技术的历史舞台。

香农的两大贡献:一是信息理论、信息熵的概念;另一是符号逻辑和开关理论。香农的信息论为明确什么是信息量概念作出了决定性的贡献。感谢香农,在定量研究的科学领域中,他将原来模模糊糊的信息概念,天才地给以了量化,使我们大家在解数学问题时也能‘牛刀小试’。

其实香农并不是给信息量化的第一人,巨人也得站在前人的肩膀上。1928年,哈特利(R.V. H. Harley)就曾建议用N log D这个量表示信息量。1949年,控制论创始人维纳将度量信息的概念引向热力学。1948年,香农认为,信息是对事物运动状态或存在方式的不确定性的描述。并把哈特利的公式扩大到概率pi不同的情况,得到信息量的公式:

  H=-pi log pi

如果计算中的对数log是以2为底的,那么计算出来的信息就以比特(bit)为单位。

根据香农的信息概念,信息能消除不确定性,而我们在解决数学题的时候,也是要消除不确定性,得到确定的答案。并不仅仅是老鼠问题和称球问题如此,我认为大多数问题都多少是一个‘消除不确定性’ 的过程。因此,我们为何不借用香农的工具,研究研究我们的问题有多少不确定性呢?也就是说,需要多少信息量才能解决这个问题?另外,根据题目所限制的手段,最多能够得到多少信息量?有无可能完全解决这个问题?等等。

具体到老鼠和毒药的问题。100瓶液体中1瓶有毒,每1瓶发生有毒的概率是1/100,这时候要确定毒药瓶所需的信息量H = -(p1logp1+p2logp2+….+p100logp100)

因为所有瓶子完全相同,这是一个等概率问题,p1 = p2 =…=p100 = 1/100

得到H=-log1/100)。

下面计算从老鼠能得到的信息量。

首先考虑问题1,即给定时间为1天的情况。一天后,每只老鼠或死或活,因此,能够提供1比特的信息。7只老鼠则能提供7比特的信息。

再看看刚才列出的确定毒药瓶所需的信息量H的公式:H=-log1/100<  -log1/128= 7比特。

因此,问题1应该可以解决。这个可能性是信息论提供给我们的。实际上,应该不仅仅是可能性,这种计算信息量比特数的方法能启发我们的思维。在解题时,学习别人解题的方法固然重要,而探讨别人是如何想到这种方法的,可能更为重要。在《大将军数学题2》的讨论中,就有博友说,如果提到2进制,此题就容易了。的确如此,如果不想到2进制,对此题往往好像有点束手无策,不知如何下手。

我们再来讨论问题2

所需要的信息量H的计算是和问题1一样的。然而,从每只老鼠能得到的信息量的计算,却可能会有所不同。这儿我用了‘可能’两个字,是因为我们还丝毫未曾谈及如何解决这个问题2

问题2和问题1的差别是在于老鼠可以参加接连两次实验。问题1中,只能做一次实验时,老鼠有两种状态:死或活。因此它可利用的信息量是1比特。如果能做两次实验,两次实验中都有生死的可能性,仅就逻辑而言,老鼠有四种可能情况:生生、生死、死生、死死。但其中的第三种情形:死生,是不可能发生的,因为在第一天的实验中死了的老鼠,不可能在第二次实验后又活过来。所以我们要将第一天实验中死了的老鼠,排除在第二次实验之外。所以,对问题2,老鼠有3种状态,每种状态的概率为1/3,因此,从一只老鼠得到的信息量

S=-1/3log1/3+ 1/3log1/3+ 1/3log1/3))= log3)。

如果将这儿的对数取以3为底的话,可以说成,每只老鼠能得到的信息量是一个3进制位(trit)。

多少只老鼠才能使总信息量大于log100)呢?

解方程:n*log(3)>log(100)  =>  3**n>100,可得到n>=5

因此,至少要5只老鼠,这便是问题2的解。

(未完待续)

链接到:大将军数学题1 

链接到:大将军数学题2




https://blog.sciencenet.cn/blog-677221-668253.html

上一篇:大将军数学题二-答案
下一篇:科学方法论--信息论、老鼠毒药问题、称球问题(全文)
收藏 IP: 24.1.57.*| 热度|

22 张启峰 傅蕴德 魏东平 曹聪 应行仁 唐常杰 鲍得海 韦玉程 徐大彬 陈国文 李欣海 王修慧 宋泽阳 李伟钢 赵凤光 田云川 李治 林涛 彭雷 crossludo qiue ddsers

该博文允许注册用户评论 请点击登录 评论 (18 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 14:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部