冯向军的科学研究博客分享 http://blog.sciencenet.cn/u/冯向军 在本博客中专门从事以统计力学为核心的理论物理研究。

博文

建立在“玻尔兹曼无穷大样本”基础上的思维并不适合小样本

已有 2487 次阅读 2017-7-22 04:39 |个人分类:概率论|系统分类:科研笔记

建立在“玻尔兹曼无穷大样本”基础上的思维

一般而言并不适合小样本

美国归侨冯向军博士,2017年7月22日写于美丽家乡

(一)数学期望

X1,X2,X3,……,Xn为这离散型随机变量,p(X1),p(X2),p(X3),……p(Xn)为概率函数。

数学期望

E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn) = X1*f1(X1) + X2*f2(X2) + …… + Xn*fn(Xn)

定理
设Y是随机变量X的函数:Y=g(X)(g(X)是连续函数)
它的分布律为
绝对收敛,则有:

由此可见数学期望只与无穷大样本空间相联系。

(二)负指数分布的数学期望

负指数分布aexp(- λx)的期望E(X)为a2

E(X)=(a/ λ)/∫xλexp(-λx)dx积分区间为0到正无穷,结果就是

E(X)=(a/ λ)* 1/λ = a/λ2

这恐怕就是认定“负指数分布,其变量的统计平均值是常量”理念的根本所在。

显然,这个结论对于小样本并不一定成立。

对张学文快刀斩乱麻实验数据的实际再计算结果表明:对于小样本的负指数分布aexp(- λx),一般而言:

变量的统计均值不等于a/λ2

建立在“玻尔兹曼无穷大样本”基础上的思维一般并不适合具有小样本的广义系统。

对于小样本负指数分布aexp(- λx),因为

pi = aexp(-λxi)

xi =1/λlog(a/pi)

变量的统计平均值 = p1x1 + p2x2 +...+pnxn

= 1/λ*(p1log(a/p1) + p2log(a/p2) +...+pnlog(a/pn)

怎能说是一与概率分布无关的常量?

注:张学文快刀斩乱麻实验中,n = 15,与无穷大样本空间实在是没关系。

如果变量的统计平均值不是与概率分布无关的常量,那么,用信息熵最大配合变量的统计平均值为常量来推导负指数分布,对小样本而言,一般就是凑数据。










https://blog.sciencenet.cn/blog-1968-1067538.html

上一篇:最大信息熵原理”悖论”
下一篇:最大信息熵原理的“负指数分布悖论“
收藏 IP: 113.222.197.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-18 08:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部