heninghuang的个人博客分享 http://blog.sciencenet.cn/u/heninghuang

博文

如何解释概率? 科学界一个迄今悬而未决的问题

已有 2172 次阅读 2024-1-20 12:16 |个人分类:统计推断与概率|系统分类:观点评述

概率的概念包括数学和哲学两个方面【1】。在数学方面,概率是在柯尔莫哥洛夫公理体系下0-1 区内的函数,科学界对此没有争议。但是在哲学方面,如何概率是科学界长期争论不休迄今仍然而未决的问题。谢钢老师在他的博文【2】中写道:“概率是统计理论与统计数据分析所依赖的基本概念与基础构建单元。很多人可能还不知道这样一个事实:统计学界至今无法在概率的定义这个基本问题上达成共识。”曾纪晴老师在他的博文【3】中写道:“为什么人们认为柯尔莫哥洛夫建立的概率定义没有问题,但面对现实生活中的各种应用领域却对概率存在许多理解上的问题呢? 在这个所谓“公理化定义”中,完全没有对概率概念的内涵作出解释。可见,这个所谓概率的公理化定义实际上并不是对概率的真正定义,因此人们在实际应用中就必然面临着对概率不同解释的问题。

概率的解释可以归纳为两大类:主观解释和客观解释。主观解释认为概率是人们对不确定事件发生的信念程度(degree of belief),它为贝叶斯学派所倡导,是贝叶斯统计推断的基础。客观解释认为概率是客体的客观属性。客观解释包括“频率”解释和“倾向度”解释。“频率”解释是频率学派统计推断的基础。但是严格来说,频率是一个经验概念,它是在重复采样过程中观察到的相对频率4】。例如置信区间的置信水平其实是相对频率,不是概率。根据 Bunge 5】的说法,“…频率本身并不能保证推断出概率……”。同是概率的客观解释,笔者认为 “倾向度”解释比“频率”解释更合理,至少对于测量学是如此【4】。

笔者在文【6】中提出了一个信息度理论”(A theory of informity)。文【7】简要介绍了信息度理论的基本内容。信息度理论中我们将概率与信息权重(或信息量)联系起来。我们定义信息量为:信息量=概率。换句话说,我们将概率解释为信息权重(或信息量)。 A显示了概率的数学概念以及从贝叶斯、倾向度和信息权重(或信息量)三个不同角度对概率的解释。

将信息量与概率联系起来不能算是笔者的原创。在香信息理论中,信息量被定义为“概率倒数的数”,即:香农信息量=log1/概率)= -log(概率)因此它的含义与我们定义的信息量(信息量=概率)的含义相反,或者说这两种信息量的定义是从相反的角度来看待事物的不确定性(或者确定性)这同一个问题。这可以类比于从两个不同的角度来看待一个装了一半水的杯子:我们可以说这个杯子里有半杯水(half full),也可以说这个杯子一半是空的(half empty)对于相同的概率值,根据这两种定义给出的信息量数值是不同的。例如对于“明天下雨的概率是80%”这条信息,我们定义的信息量0.8, 信息量是-log2(0.8)=0.3219比特。对于“明天下雨的概率是20%”这条信息,我们定义的信息量0.2信息量是-log2(0.2)=2.3219比特。概率减小,我们定义的信息量减小,香信息量增大。笔者认为,我们定义的信息量比香信息量直观,符合人们对信息的感性认识:即信息量(以及信息度)的增大对应于不确定性的减小,因此不会有违和感。而香信息量不够直观,而且与人们关于信息的感性认识有一种违和感:即香信息量(以及信息熵)的增大对应于不确定性的增大。

各位网友:您倾向于概率的哪种解释呢?

image.png

参考文献

1Galavotti, M. C. (2017) The interpretation of probability: still an open issue? Philosophies, 2(3), 20 https://doi.org/10.3390/philosophies2030020

2谢钢 2022 统计学界至今无法在概率的定义这个基本问题上达成共识,科学网,https://blog.sciencenet.cn/blog-3503579-1321302.html

3曾纪晴 (2022) 概率的定义及其本质, 科学网, https://blog.sciencenet.cn/home.php?mod=space&uid=52021&do=blog&quickforward=1&id=1362245

4Huang, H. (2023) A propensity-based framework for measurement uncertainty analysis, Measurement, 112693, https://doi.org/10.1016/j.measurement.2023.112693

5Bunge, M. (1981) Four concepts of probability Applied Mathematical, Modelling, 5(5), 306-312.

6Huang, H. (2023) A theory of informity, preprint, ResearchGatehttps://www.researchgate.net/publication/376206296_A_theory_of_informity

7Huang, H. (2024) 信息度理论简介,科学网, https://blog.sciencenet.cn/home.php?mod=space&uid=3427112&do=blog&id=1416192



https://blog.sciencenet.cn/blog-3427112-1418708.html

上一篇:“统计学改革:实际工作者的观点”预印本更新
下一篇:从信息损失的角度评估“学生氏t-分布”及“scaled and shifted t-分布”
收藏 IP: 104.63.253.*| 热度|

22 尤明庆 武夷山 刘全慧 王涛 张学文 宁利中 汪运山 梁洪泽 农绍庄 杨正瓴 冯兆东 杨顺楷 王安良 郑永军 孙颉 王成玉 胡泽春 李剑超 葛及 李学宽 叶晓明 刘跃

该博文允许注册用户评论 请点击登录 评论 (12 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 13:06

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部