博文

[讨论] “随机性”主要来自“确定性”的信息丢失

已有 2667 次阅读 2025-10-22 21:26 |个人分类:科学 - 艺术 - 本质|系统分类:科研笔记

[讨论] “随机性”主要来自“确定性”的信息丢失

一、优先权？

我代表爱因斯坦重申：

现实的物理世界，从根本上说是“确定性”的。

所谓的“随机性”，一般是对“确定性”认识中“信息”的丢失引起。

差不多可以活用一下普朗克：

1933年2月17日，普朗克在柏林为德国工程师协会所做演讲中说：

“科学是内在的整体，它被分解为单独的整体不是取决于事物的本身，而是取决于人类认识能力的局限性。实际上存在着从物理到化学，从生物学和人类学到社会学的连续的链条，这是任何一处都不能被打断的链条。”

二、庞加莱与希尔伯特

2.1 庞加莱

The mathematical facts worthy of being studied are those which, by their analogy with other facts, are capable of leading us to the knowledge of a physical law. They reveal the kinship between other facts, long known, but wrongly believed to be strangers to one another.

Quoted in N Rose Mathematical Maxims and Minims (Raleigh N C 1988).

值得研究的数学事实是那些通过与其他事实的类比，能够引导我们了解物理定律的事实。它们揭示了其他事实之间的亲缘关系，这些事实早已为人所知，但被错误地认为彼此陌生。

https://mathshistory.st-andrews.ac.uk/Biographies/Poincare/quotations/

2.2 希尔伯特

The further a mathematical theory is developed, the more harmoniously and uniformly does its construction proceed, and unsuspected relations are disclosed between hitherto separated branches of the science.

Quoted in N Rose Mathematical Maxims and Minims (Raleigh N C 1988).

数学理论发展得越深入，其构建就越协调一致，迄今为止分离的科学分支之间的关系也就越明显。

https://mathshistory.st-andrews.ac.uk/Biographies/Hilbert/quotations/

参考资料：

[1] 2024-12-13，统计学/statistics/袁卫，王星，中国大百科全书，第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=208374&Type=bkzyb&SubID=59818

研究在不确定的环境下，通过收集和分析数据，进而提炼可靠信息，为各学科、领域和社会提供知识，帮助决策的科学。它既根植于各个领域的实践，又致力于为各个领域提供科学服务。

主要代表人物

L.A.J.凯特尔、F.高尔顿、K.皮尔逊、W.S.戈塞特、R.A.费希尔、J.奈曼、E.S.皮尔逊、A.瓦尔德、J.W.图基等

代表著作

《科学的规范》《研究人员的统计方法》《数据分析的未来》

国际上统计学（Statistics）定义明确，就是研究数据的科学。

统计的应用领域包括人口调查、语言解码、行星运动、税收预算、金融分析、测量误差、出生与死亡统计等。

大数据时代，数据不再出自理想环境，现实问题复杂多变，整个科学研究都面临着弱可信环境下的“复现性危机”。这就需要发挥数据可复现性和可重复性这个研究视角优势，在统计科学的指导下，推进科研全系列、全流程数据规范体系的建设。

[2] 2024-05-31，数理统计/mathematical statistics/陈希孺，撰周勇修订，中国大百科全书，第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=149136&Type=bkzyb&SubID=59827

研究有效收集、整理和分析带有随机性的数据，以对所考察的问题作出推断或预测，直至为采取一定的决策和行动提供依据和建议的方法和理论。

统计学是以数据为研究对象、以相关科学为背景，分析和处理数据、建立统计模型、应用数学与计算机科学获得结论、解释相关科学现象、寻找客观规律的一门科学。数理统计主要叙述并研究有效地收集、整理和分析数据，对所考察的问题作出推断或预测，直至为采取一定的决策和行动提供依据和建议。

[3] 2022-01-20，数理统计学/mathematical statistics/，中国大百科全书，第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=181967&Type=bkzyb&SubID=61702

以概率论和数学其他分支的理论为基础，采用观察性研究和试验性研究获取科学数据，研究分析科学数据的数学模型和理论方法。是数学的分支学科，也是统计学最基础最核心的部分。

由样本计算出的特征数字，在数理统计中称统计量，统计量可以看作解决某些问题的数据解释，人们可以根据统计量的数值情况进行决策。

[4] 2024-12-03，统计推断/statistical inference/柏杨，中国大百科全书，第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=191731&Type=bkzyb&SubID=61705

利用样本数据对总体的特征做出估计和预测的方法。

统计推断有两种常见的方法：一种是频率统计推断，又称经典的统计推断，如置信区间、p-值等都基于频率统计推断的范畴；另一种是贝叶斯统计推断，如可信区间、贝叶斯因子等都属于贝叶斯统计推断的范畴。因为统计推断是利用样本去推断总体的特征，由于总体的不均匀性和样本的随机性，有时样本不能很好地代表总体。因此提高统计推断准确性的一个途径是采取适当的抽样方法确保抽样的“代表性”，常用的随机抽样方法有简单随机抽样、分层抽样、系统抽样和整群抽样等。

[5] 2024-12-03，非参数统计/nonparametric statistics/孙志华，中国大百科全书，第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=296325&Type=bkzyb&SubID=81651

统计学中具有对总体特征不做假定或仅做一般性假定特点的重要分支。

最简单的非参数估计方法为直方图方法。常用的非参数估计方法有局部常数核估计方法，包括局部常数核估计和局部线性核估计等，以及近邻估计等。常见的非参数检验方法有秩和检验、符号检验，游程检验等。

[6] 2024-12-05，贝叶斯推断/Bayesian inference/朱军，中国大百科全书，第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=316492&Type=bkzyb&SubID=81554

一种从先验分布和经验数据更新模型后验概率的统计推断方法。

似然函数主要根据问题属性来定义，例如对连续变量的数据，常用高斯分布；此外，对于复杂数据，似然函数往往包含隐含变量（例如混合高斯模型、隐含话题模型等），即在训练集中不能直接观察的变量。后验分布的计算往往是最有挑战性，特别是在机器学习领域，要进行后验推断的变量维度往往很高或者模型中包括隐含变量，除了一些特殊的情况，精确的后验推断一般不可行，因此，发展了近似贝叶斯推断的相关理论和算法，主要包括变分推断和蒙特卡洛采样算法。

[7] 2024-12-05，贝叶斯学派/Bayesian/郁文，中国大百科全书，第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=495443&Type=bkzyb&SubID=59841

从对总体参数进行统计推断的角度而言，贝叶斯学派的基本思想是将总体参数视为随机变量，在对参数进行统计推断时，除了使用样本所提供的信息外，还必须对参数规定一个先验分布。贝叶斯学派将先验分布解释为在抽样前就已有的关于参数先验信息的概率表述，先验分布不必有客观依据，其可以部分地或完全地基于主观信念。随后，结合先验分布与样本的分布，用概率论中求解条件概率分布的方法，计算出在给定样本观测值的条件下，所关心参数的条件分布，这个分布是抽样之后获得的，故称为后验分布。

贝叶斯方法对任何统计问题都给以一种程式化的解法，这导致研究者对问题不去做深入分析，而只是机械地套用公式。贝叶斯学派则认为：在一定条件下可以证明，任何合理的优良性准则必然对应于一定先验分布的贝叶斯准则，因此每个统计学者自觉或不自觉地都是“贝叶斯主义者”。而贝叶斯方法对统计推断和决策问题给出程式化的解是优点而非缺点，因为它免除了寻求抽样分布这个困难的数学问题，而且这种程式化的解法并不是机械地套公式，要求研究者对先验分布、损失函数等的选择做大量的工作。

以前的《科学网》相关博文链接：

[1] 2025-08-17 21:21，[资料，科普] 量子力学的哥本哈根诠释（7）： EPR佯谬

https://blog.sciencenet.cn/blog-107667-1498056.html

[2] 2025-04-24 22:51，[打听，优先权] 生成更好的随机数（关联：David Zuckerman, Eshan Chattopadhyay）

https://blog.sciencenet.cn/blog-107667-1483303.html

[3] 2023-03-31 18:17，[小资料，擂台] 随机数，伪随机数，真随机数

https://blog.sciencenet.cn/blog-107667-1382520.html

[4] 2021-07-27 17:26，[苦啊！] 到底为什么“正态分布随机数不能被预报？”

https://blog.sciencenet.cn/blog-107667-1297235.html

[5] 2021-07-23 16:45，[阅读笔记] 均匀分布随机数之和

https://blog.sciencenet.cn/blog-107667-1296695.html

[6] 2021-07-22 15:56，[重大困惑] 为什么正态分布随机数不能“被”预测