博文

学生氏t-分布的3个问题(再谈“学生氏t-分布”更新版)

已有 2291 次阅读 2026-3-17 06:05 |个人分类:统计推断与概率|系统分类:观点评述

学生氏t-分布无疑是统计学中最著名的抽样分布之一（以下简称t-分布）。笔者曾经在多篇论文及博文中讨论了t-分布【1-5】。这里概述t-分布的3个问题。

一、t-分布不是描述任何物理现象的数学模型

概率分布是为分析（测量）数据建立的数学模型。因此，概率分布应该描述数据包含的物理现象。例如，正态分布是测量误差模型，因此又被称为“误差定律”。又例如，瑞利分布是海浪波高模型，描述波高的统计分布这一物理现象。那么t-分布是描述哪种物理现象的数学模型呢？统计量t是样本误差ε与样本标准差s的比值。样本误差ε和样本标准差s都有明确的物理意义：前者是（单个）噪声的量度，后者是系统平均噪声的量度。（单个）噪声是一个随机变量；而系统平均噪声也是一个随机变量，两者的比值t 的物理意义不明确。因此，t-分布不是描述任何物理现象的数学模型。然而人们对t-分布有两个误解。其一是误以为标准t-分布是标准化的误差分布，其二是误以为Scaled and shifted t-分布（即转换到原始样本空间后的t-分布）是样本均值量的抽样分布。然而，根据中心极限定理，标准化的误差分布是标准正态分布，而样本均值量的抽样分布是正态分布。

二、t-分布是一个纯粹通过数学演算得到的概率分布

两大统计学派（频率学派和贝叶斯学派）采用不同的推理/演算方法得到t-分布。频率学派借助于 “t-转换”推导出t-分布。t-转换将样本误差ε与样本标准差s构成的二维空间扭曲成样本t的一维空间。因此，t-分布本质上是一个“扭曲”的正态分布【1】。

如果说频率学派推导t-分布的数学方法还算严谨，那么贝叶斯学派则完全是“凑巧”采用1/σ先验才得到t-分布。如果采用其它先验，例如1/σ²，就不能得到t-分布。对于给定的数据（数据是唯一的），采用不同的先验会导致不同的后验分布。这是贝叶斯方法长期以来受到质疑并且悬而未决的一个问题。另外，一些贝叶斯学者认为1/σ先验不符合正态分布参数的物理意义，因此否定t-分布的有效性（例如【6】）。

三、t-分布不符合“最小信息熵准则”和“最大信息度准则”

对于给定的一组数据：n个重复测量数据，我们可以得到两个样本统计量的数值：样本均值和标准误。利用这两个数值并且假定原始数据服从正态分布，我们可以构建关于样本均值的两个备选经验概率分布：scaled and shifted t-分布和正态分布（又称为scaled and shifted z-分布）。那么，这两个备选概率分布哪一个更好？我们可以借助于信息学中的两个准则：“最小信息熵准则”和“最大信息度准则”来评估这两个备选概率分布。

“最小信息熵准则”表述为：对于给定的数据考虑一组备选概率分布，最佳分布是具有最小信息熵的分布【7】。“最大信息度准则”表述为：对于给定的数据考虑一组备选概率分布，最佳分布是具有最大信息度的分布【8】。这两个准则是等价的或者说是互补的，因为信息熵和信息度的含义相反：信息熵是系统不确定性的量度，而信息度是系统确定性的量度。

文【7】的信息熵分析结果表明：正态分布的信息熵总是小于scaled and shifted t-分布的信息熵。文【8】的信息度分析结果表明：正态分布的信息度总是大于scaled and shifted t-分布的信息度。因此，无论从信息熵还是信息度的角度，scaled and shifted t-分布都不是样本均值的最佳概率分布。

总之，t-分布（以及scaled and shifted t-分布）是一个纯粹通过数学推理/演算得到的概率分布，其有效性即缺乏物理基础，又缺乏信息学基础。因此，t-分布的应用其实会误导科学推断。例如，t-分布在测量不确定度分析的应用中导致两个悖论，感兴趣的读者可以参见【1、5】，这里不再赘述。

参考文献

【1】Huang H (2018) Uncertainty estimation with a small number of measurements, Part I: new insights on the t-interval method and its limitations Measurement Science and Technology 29 https://doi.org/10.1088/1361-6501/aa96c7

【2】黄河宁（2020）为什么基于t-分布计算小样本测量不确定度是一个谬误？-3 个悖论及其消解，ResearchGate 链接：https://www.researchgate.net/publication/343039726_weishenmejiyu_t-fenbujisuanxiaoyangbenceliangbuquedingdushiyigemiuwu_-3_gebeilunjiqixiaojie

【3】黄河宁（2022）关于学生氏t-分布的几点澄清，科学网，https://blog.sciencenet.cn/blog-3427112-1352436.html

【4】黄河宁（2022）为什么会产生对t-值和学生氏t-分布的认知偏差？科学网，https://blog.sciencenet.cn/blog-3427112-1353059.html

【5】黄河宁（2022）“基于学生氏t-分布推断的谬误：两个悖论及其解决方法，及‘t-转换扭曲’”—PPT文件, 科学网，https://blog.sciencenet.cn/blog-3427112-1349082.html

【6】D’Agostini G 1998 Jeffeys priors versus experienced physicist priors: arguments against objective Bayesian theory Proceedings of the 6^th Valencia International Meeting on Bayesian Statistics (Alcossebre, Spain, May 30^th-June 4^th)

【7】Huang, H. (2023) A minimum entropy criterion for distribution selection for measurement uncertainty analysis, Measurement Science and Technology, 35 (2024) 035014, https://iopscience.iop.org/article/10.1088/1361-6501/ad1476

【8】Huang, H. （2025）The theory of informity: a novel probability framework. Bulletin of Taras Shevchenko National University of Kyiv, Physics and Mathematics, 80(1), 53-59. DOI: https://doi.org/10.17721/1812-5409.2025/1.7