||
[讨论] 物理理论当代实验验证的根本性困难(1):有限的样本容量
一、物理理论的实体实验验证,目前仍然存在诸多根本性的困难
一些具体的原因:
(1)有限的实验数据。对应数理统计学(mathematical statistics)中的“样本容量 sample size”。
(2)小变化范围时,“非线性的方程/数学公式”的“公式变化”,和“测量误差”具有一定的互换性。亦即,难以区分是“公式变化”,还是“测量误差”。
(3)其它原因。
其中(1)、(2),目前主要受制于当代人类科技的发展水平,我很想知道哪里有现成的解决方法。
二、样本容量的作用:标准正态分布的均值、方差
根据数理统计学,总体分布(理论分布)里的统计量的“点估计 point estimation”结果,在有限的样本容量下,几乎总会出现偏差。一般样本容量越小,偏差越大。
要想达到4位有效数字的点估计,需要的独立同分布(independent identically distributed, iid)样本容量,往往是数十万(數十萬)之上。
下面是一个直观的演示:
根据数理统计学,标准正态分布的均值=0、方差=1。
用数字计算机生成“标准正态分布”的伪随机数,依次增大样本容量,求其均值、方差。实际上,就是有限样本的“样本均值”、“样本方差”。

图1 标准正态分布:样本容量 2~10000 时的样本均值

图2 标准正态分布:样本容量 2~10000 时的样本方差

图3 数理统计学:正态分布参数的置信区间
《简明数学手册编写组》. 简明数学手册(修订本)[M]. 上海: 上海教育出版社, 1991-05,第 5-36 页
这是对《刘全慧,2025-07-07 08:15,从经验到原理的飞跃--试答杨立坚教授之问》里观点的一个直观的注释。
https://blog.sciencenet.cn/blog-3377-1492652.html

对温伯格对薛定谔方程引入的小修正的彻底否定,也是来自“遥远”的实验结果。小修正允许进行超光速通讯,这会导致因果性的破坏,和现代物理学结果直接矛盾。

物理学基本理论还有一个来自内部的检验,含自洽性,对称性,基本物理量的不可直接检验性(例如熵和波函数),等等。
四、结语
一方面,物理学必须用来指导实验,而且必须要有实验的检验,这是主要矛盾。另一方面,物理学的原理不是唯象理论,既不能从实验结果中通过归纳推理而直接得到,也不能直接检验,这是次要矛盾。
https://blog.sciencenet.cn/blog-3377-1492652.html
参考资料:
[1] 科学网,2021-06-17 10:18:31,当测试广义相对论时,微小建模误差能快速累积
https://news.sciencenet.cn/htmlpaper/2021/10/202110111018314267031.shtm
[1-2] Christopher J. Moore, Eliot Finch, Riccardo Buscicchio, Davide Gerosa. Testing general relativity with gravitational-wave catalogs: The insidious nature of waveform systematics. iScience, 2021, 24(6): 102577.
25 June 2021
doi: 10.1016/j.isci.2021.102577
https://www.sciencedirect.com/science/article/pii/S2589004221005459
https://www.cell.com/iscience/fulltext/S2589-0042(21)00545-9
[2] 孙昌璞. 当代理论物理发展趋势之我见 —杨振宁学术思想启发的若干思考[J]. 物理学报, 2022, 71(1): 010101.
doi: 10.7498/aps.71.20212307
Sun Chang-Pu. My prospective on the contemporary trend of theoretical physics inspired by Chen-Ning Yang. Acta Phys. Sin., 2022, 71(1): 010101.
https://wulixb.iphy.ac.cn/cn/article/doi/10.7498/aps.71.20212307
在李政道、杨振宁发现宇称不守恒并建立中微子二分量以前, 关于μ子到正负电子衰变的实验分支比在一定范围内是andom. 后来, 李政道和杨振宁的1956—1957 年理论预言的分支比是3/4.此后10 年, 人们进行多次实验, 最后分支比的测量值稳定逼近3/4 (图3). 意味深长的是, 每一次实验的误差条都落在前一个实验误差条里边[16].这个事例告诉大家, 如果“理论-实验-再实验”不能“背靠背”地进行, 单次实验观察一定不能完全独立于理论去无偏地验证理论预言, 仅凭一次实验通常无法给出理论正确性的客观检验, 只有多次实验才能逼近理论描述“客观实在”.
[3] 庆承瑞, 何祚麻. 科学实验中的“双盲”准则[J]. 现代物理知识, 1996, 8(01): 27-29.
http://mp.ihep.ac.cn/article/id/10464
[4] Gregory Radick. Beyond the "Mendel-Fisher controversy"[J]. SCIENCE, 2015, 350 (6257): 159-160. OCT 9 2015.
doi: 10.1126/science.aab3846
https://www.science.org/doi/10.1126/science.aab3846
https://science.sciencemag.org/content/350/6257/159
[5] 刘全慧,2025-07-07 08:15,从经验到原理的飞跃--试答杨立坚教授之问
精选
https://blog.sciencenet.cn/blog-3377-1492652.html
[6] 刘全慧,2025-07-04 08:27,如何评价Jaynes认为概率论是全部科学的逻辑?
精选
https://blog.sciencenet.cn/blog-3377-1492262.html
第三,Jaynes的过人之处。他1950年代用熵或者信息理论重新表述吉布斯的理论,看上去无非把统计物理重新表述了一遍。不要忘记,爱因斯坦最为大众所知的贡献无非把狭义相对论重新表述了一遍。后来,Jaynes认为改写吉布斯的理论是不够的,概率应该是全部科学的逻辑。因此,如果把哲学家对吉布斯的评价中,把吉布斯等词替换成概率论,完全通顺也完全正确。
[7] 2024-12-04,序贯估计/sequential estimation/李启寨,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=219818&Type=bkzyb&SubID=61720
序贯估计不是等所有可供使用的数据全部采样完再处理,而是按照序贯抽样的阶段对当前所有已经抽取的数据实时地进行统计推断,直到样本提供足够的信息,能做出恰当的推断为止。序贯估计包括序贯点估计和序贯区间估计。根据估计方法和评价准则的不同,又可分为序贯贝叶斯估计、序贯最小二乘估计、序贯最小均方误差估计和序贯最小最大估计等。相比于固定抽样方案的非序贯估计,序贯估计有两个方面的优势:①效率更高。在同样的精度下,序贯估计所需的样本量更小。②在某些情况下,不存在满足要求的非序贯估计,但存在符合要求的序贯估计。
[8] 2024-12-03,点估计/point estimation/柏杨,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=191745&Type=bkzyb&SubID=61706
[9] 2024-02-28,序贯抽样检验/sequential sampling inspection/崔恒建,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=107655&Type=bkzyb&SubID=59878
[10] 2024-01-27,序贯随机抽样法/sequential sampling/杨德,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=527149&Type=bkzyb&SubID=216827
[11] 2024-04-10,序贯次序统计量/sequential order statistics/丁维勇,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=195091&Type=bkzyb&SubID=127840
[12] 2024-12-03,序贯区间估计/sequential interval estimation/崔霞,崔恒建,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=235103&Type=bkzyb&SubID=59861
[13] 2024-12-03,序贯贝叶斯解/sequential Bayesian solution/徐勤丰,中国大百科全书,第三版网络版[DB/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=238164&Type=bkzyb&SubID=59842
以前的《科学网》相关博文链接:
[1] 2021-12-27 20:13,[求证] 广义相对论通过迄今最严苛测试?
https://blog.sciencenet.cn/blog-107667-1318413.html
[2] 2025-05-16 22:21,[讨论,猜想,优先权] 非线性方程的解在小范围变化时:其重构方程的“变方程”与“变参数”等效
https://blog.sciencenet.cn/blog-107667-1485997.html
[3] 2024-08-30 22:41,[物理,实验,打听] 李政道老师“测量μ子到正负电子衰变的分支比”的原始数据和图片
https://blog.sciencenet.cn/blog-107667-1448940.html
[4] 2024-07-16 22:41,[讨论,随感] 一两个物理实验,不足以肯定一个物理理论
https://blog.sciencenet.cn/blog-107667-1442549.html
[5] 2024-07-15 22:49,[笔记,随感] 物理理论与物理实验
https://blog.sciencenet.cn/blog-107667-1442409.html
[6] 2022-06-02 15:53,[讨论] 从孟德尔“豌豆实验”到流体力学 Navier–Stokes 方程
https://blog.sciencenet.cn/blog-107667-1341284.html
[7] 2020-12-1 14:13,[建议] 重复孟德尔的生物学豌豆实验
https://blog.sciencenet.cn/blog-107667-1260648.html
[8] 2025-05-14 22:29,[笔记,数学] 泰勒级数展开 Taylor series expansion
https://blog.sciencenet.cn/blog-107667-1485748.html
感谢您的指教!
感谢您指正以上任何错误!
感谢您提供更多的相关资料!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-17 10:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社