heninghuang的个人博客分享 http://blog.sciencenet.cn/u/heninghuang

博文

学生氏t-分布的3个问题(再谈“学生氏t-分布”更新版)

已有 581 次阅读 2026-3-17 06:05 |个人分类:统计推断与概率|系统分类:观点评述

学生氏t-分布无疑是统计学中最著名的抽样分布之一(以下简称t-分布)。笔者曾经在多篇论文及博文中讨论了t-分布【1-5】。这里概述t-分布的3问题。

t-分布不是描述任何物理现象的数学模型

概率分布是为分析(测量)数据建立的数学模型。因此, 概率分布应该描述数据包含的物理现象。例如,正态分布是测量误差模型,因此又被称为“误差定律”。又例如,瑞利分布是海浪波高模型,描述波高的统计分布这一物理现象。那么t-分布是描述哪种物理现象的数学模型呢?统计量t是样本误差ε与样本标准差s的比值。样本误差ε和样本标准差s都有明确的物理意义:前者是(单个)噪声的量度,后者是系统平均噪声的量度。(单个)噪声是一个随机变量;而系统平均噪声也是一个随机变量,两者的比值t 的物理意义明确。因此,t-分布不是描述任何物理现象的数学模型。然而人们对t-分布有两个误解。其一是误以为标准t-分布是标准化的误差分布,其二是误以为Scaled and shifted t-分布(即转换到原始样本空间后的t-分布)是样本均值量的抽样分布。然而,根据中心极限定理,标准化的误差分布是标准正态分布,而样本均值量的抽样分布是正态分布。

二、t-分布是一个纯粹通过数学演算得到的概率分布

两大统计学派(频率学派和贝叶斯学派)采用不同的推理/演算方法得到t-分布。频率学派借助于 “t-转换”推导出t-分布。t-转换将样本误差ε与样本标准差s构成的二维空间扭曲成样本t一维空间。因此,t-分布本质上是一个“扭曲”的正态分布【1】。

如果说频率学派推导t-分布的数学方法还算严谨,那么贝叶斯学派则完全是凑巧采用1/σ先验才得到t-分布。如果采用其它先验,例如1/σ2,就不能得到t-分布。对于给定的数据(数据是唯一的),采用不同的先验会导致不同的后验分布。这贝叶斯方法长期以来受到质疑并且悬而未决的一个问题。另外,一些贝叶斯学者认为1/σ先验不符合正态分布参数的物理意义,因此否定t-分布的有效性(例如【6】)。

三、t-分布不符合“最小信息熵准则”和“最大信息度准则”

对于给定的一组数据:n个重复测量数据,我们可以得到两个样本统计量的数值:样本均值和标准误。利用这两个数值并且假定原始数据服从正态分布,我们可以构建关于样本均值的两个备选经验概率分布:scaled and shifted t-分布和正态分布(又称为scaled and shifted z-分布)。那么,这两个备选概率分布哪一个更好?我们可以借助于信息学中的两个准则:“最小信息熵准则”和“最大信息度准则”来评估这两个备选概率分布

“最小信息熵准则”表述为:对于给定的数据考虑一组备选概率分布,最佳分布是具有最小信息熵的分布【7最大信息度准则”表述为:对于给定的数据考虑一组备选概率分布,最佳分布是具有最大信息度的分布【8这两个准则是等价的或者说是互补的,因为信息熵和信息度的含义相反:信息熵是系统不确定性的量度,而信息度是系统确定性的量度。

文【7】的信息熵分析结果表明:正态分布的信息熵总是小于scaled and shifted t-分布的信息熵。文【8信息度分析结果表明:正态分布的信息度总是大于scaled and shifted t-分布的信息度。因此,无论从信息熵还是信息度的角度,scaled and shifted t-分布都不是样本均值的最佳概率分布

总之,t-分布(以及scaled and shifted t-分布)是一个纯粹通过数学推理/演算得到的概率分布,其有效性即缺乏物理基础,又缺乏信息学基础。因此,t-分布的应用其实会误导科学推断。例如,t-分布在测量不确定度分析的应用中导致两个悖论,感兴趣的读者可以参见【1、5】,这里不再赘述。

参考文献

1Huang H (2018) Uncertainty estimation with a small number of measurements, Part I: new insights on the t-interval method and its limitations Measurement Science and Technology 29  https://doi.org/10.1088/1361-6501/aa96c7

2  黄河宁(2020为什么基于t-分布计算小样本测量不确定度是一个谬误?-3 个悖论及其消解,ResearchGate 链接:https://www.researchgate.net/publication/343039726_weishenmejiyu_t-fenbujisuanxiaoyangbenceliangbuquedingdushiyigemiuwu_-3_gebeilunjiqixiaojie

3  黄河宁(2022关于学生氏t-分布的几点澄清,科学网,https://blog.sciencenet.cn/blog-3427112-1352436.html

4  黄河宁(2022为什么会产生对t-值和学生氏t-分布的认知偏差?科学网,https://blog.sciencenet.cn/blog-3427112-1353059.html

5  黄河宁(2022基于学生氏t-分布推断的谬误:两个悖论及其解决方法,及‘t-转换扭曲’”—PPT文件科学网,https://blog.sciencenet.cn/blog-3427112-1349082.html

6D’Agostini G 1998  Jeffeys priors versus experienced physicist priors: arguments against objective Bayesian theory Proceedings of the 6th Valencia International Meeting on Bayesian Statistics (Alcossebre, Spain, May 30th-June 4th)

7Huang, H. (2023) A minimum entropy criterion for distribution selection for measurement uncertainty analysis,  Measurement Science and Technology, 35 (2024) 035014,  https://iopscience.iop.org/article/10.1088/1361-6501/ad1476

8Huang, H. 2025The theory of informity: a novel probability framework.  Bulletin of Taras Shevchenko National University of KyivPhysics and Mathematics, 80(1), 53-59.  DOI: https://doi.org/10.17721/1812-5409.2025/1.7



https://blog.sciencenet.cn/blog-3427112-1526051.html

上一篇:学术(科学)论文的“新颖性悖论”(更新版)
收藏 IP: 104.63.253.*| 热度|

8 张学文 刘进平 宁利中 杨正瓴 王安良 钟炳 胡泽春 郑永军

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-3-18 14:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部