||
笔者曾经在多篇论文、文章、及博文中讨论了学生氏t-分布【1-5】。 挑战这个具有一百多年历史的概率分布需要从各个方面提供有力的论据。概率分布也是一种数学模型。如果我们认为(或者假定)学生氏t-分布是一个有效的数学模型,那么它的有效性成立的基础是什么?这里我们从物理和信息学两个方面来考虑这个问题。
一、物理基础
首先,概率分布是人们为了分析(物理现象测量)数据建立的数学模型。换句话说, 概率分布应该描述数据包含的某种物理现象,这是概率分布有效性的物理基础。例如正态分布是测量误差模型,因此又被称为“误差定律”。又例如,瑞利分布是海浪波高模型,描述波浪这一物理现象。那么学生氏t-分布是描述哪种物理现象的数学模型呢?我们知道,统计量t是样本误差ε与样本标准差s的比值。样本误差ε和样本标准差s是现实世界的物理量,它们都有明确的物理意义:前者是噪声后者是平均噪声的量度。但是两者的比值t 不是现实世界的物理量。因此,学生氏t-分布不是描述任何物理现象的数学模型,它没有物理基础。然而人们对学生氏t-分布有两个误解。其一是误以为标准t-分布是测量误差的分布,其二是误以为Scaled and shifted t-分布(即转换到原始样本空间后的t-分布)是样本均值量的抽样分布。根据中心极限定理,样本均值量的抽样分布是正态分布,不是Scaled and shifted t-分布。
二、信息学基础
对于给定的一组数据:n个重复测量数据,我们可以得到两个样本统计量的数值:样本均值和标准误。利用这两个数值,我们可以构建关于样本均值的两个备选经验概率分布:scaled and shifted t-分布和正态分布(又称为scaled and shifted z-分布)。那么,这两个备选概率分布哪一个更好?我们可以借助于信息学中的两个准则:“最小信息熵准则”和“最大信息度准则” 从信息损失的角度来评估这两个备选概率分布。
“最小信息熵准则”表述为:对于给定的数据考虑一组备选概率分布,最佳分布是具有最小信息熵的分布【6】。“最大信息度准则”表述为:对于给定的数据考虑一组备选概率分布,最佳分布是具有最大信息度的分布【7】。这两个准则是等价的,因为信息熵和信息度的含义相反:信息熵是系统不确定性的量度,而信息度是系统确定性的量度。
文【6】的计算结果表明:正态分布的信息熵总是小于scaled and shifted t-分布的信息熵。文【7】的计算结果表明:正态分布的信息度总是大于scaled and shifted t-分布的信息度。因此,无论从信息熵还是信息度的角度,scaled and shifted t-分布总是比正态分布损失更多的信息。
因此,学生氏t-分布 (以及scaled and shifted t-分布)的有效性即缺乏物理基础。又缺乏信息学基础。
事实上,学生氏t-分布是一个纯粹通过数学演算得到的概率分布。众所周知,学生氏t-分布可以根据两大统计学派的方法得到。对于频率学派,它的数学推导过程没有问题。但是对于贝叶斯学派,必须采用1/σ先验才能得到学生氏t-分布;如果采用其它先验,比如1/σ2,就不能得到学生氏t-分布。先验的不唯一性导致不同的后验分布本身就是一个问题。一些贝叶斯学者认为1/σ先验不符合正态分布参数的物理意义,因此否定学生氏t-分布的有效性(例如【8】)。
频率学派的方法推导学生氏 t-分布借助于 “t-转换”。由于 ‘t-转换扭曲’,基于学生氏 t-分布进行统计推断(例如t-区间)是错误的。学生氏 t-分布本质上是一个“扭曲”的正态分布(由于t-转换扭曲)。理解‘t-转换扭曲’可以纠正对t-值和学生氏t-分布的认知偏差,从而正确认识学生氏t-分布的特性【4】。
参考文献
【1】Huang H (2018) Uncertainty estimation with a small number of measurements, Part I: new insights on the t-interval method and its limitations Measurement Science and Technology 29 https://doi.org/10.1088/1361-6501/aa96c7
【2】 黄河宁(2020)为什么基于t-分布计算小样本测量不确定度是一个谬误?-3 个悖论及其消解,ResearchGate 链接:https://www.researchgate.net/publication/343039726_weishenmejiyu_t-fenbujisuanxiaoyangbenceliangbuquedingdushiyigemiuwu_-3_gebeilunjiqixiaojie
【3】 黄河宁(2022)关于学生氏t-分布的几点澄清,科学网,https://blog.sciencenet.cn/blog-3427112-1352436.html
【4】 黄河宁(2022)为什么会产生对t-值和学生氏t-分布的认知偏差?科学网,https://blog.sciencenet.cn/blog-3427112-1353059.html
【5】 黄河宁(2022)“基于学生氏t-分布推断的谬误:两个悖论及其解决方法,及‘t-转换扭曲’”—PPT文件, 科学网,https://blog.sciencenet.cn/blog-3427112-1349082.html
【6】Huang, H. (2023) A minimum entropy criterion for distribution selection for measurement uncertainty analysis, Measurement Science and Technology, 35 (2024) 035014, https://iopscience.iop.org/article/10.1088/1361-6501/ad1476
【7】Huang, H. (2023) A theory of informity, preprint, ResearchGate,https://www.researchgate.net/publication/376206296_A_theory_of_informity
【8】D’Agostini G 1998 Jeffeys priors versus experienced physicist priors: arguments against objective Bayesian theory Proceedings of the 6th Valencia International Meeting on Bayesian Statistics (Alcossebre, Spain, May 30th-June 4th)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 06:07
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社