求真分享 http://blog.sciencenet.cn/u/zlyang 求真务实

博文

[数学文化,笔记] 正态分布的多种稳定性质(关联不能被预报预测)

已有 1590 次阅读 2024-11-1 22:49 |个人分类:基础数学-逻辑-物理|系统分类:科研笔记

[数学文化,笔记] 正态分布的多种稳定性质(关联不能被预报预测)

                        

Abraham de Moivre   mw191475_564x800.jpg

图1  棣莫弗 Abraham de Moivre, 1666-05-26 ~ 1754-11-27, 87

https://collectionimages.npg.org.uk/large/mw191475/Abraham-de-Moivre.jpg

            

              

一、正态分布在数学方面具有多种稳定性质

https://www.global-sci.org/intro/article_detail/mc/11639.html

https://www.global-sci.org/intro/articles_list/mc/1412.html

      

   1. 两个正态分布密度的乘积还是正态分布

   2. 两个正态分布密度的卷积还是正态分布,也就是两个独立正态分布随机变量的和还是服从正态分布

   3. 正态分布 N(0,σ2) 的傅立叶变换正规化为密度分布后还是正态分布

   4. 中心极限定理保证了多个随机变量的求和效应将导致正态分布

   5. 正态分布和其它具有相同均值、方差的概率分布相比,具有最大熵

             

   前三个性质说明了正态分布一旦形成,就容易保持该形态的稳定,兰登对于正态分布的推导也表明了,正态分布可以吞噬较小的干扰而继续保持形态稳定。后两个性质则说明,其它的概率分布在各种的操作之下容易越来越靠近正态分布。正态分布具有最大熵的性质,所以任何一个对指定概率分布的操作,如果该操作保持方差的大小,却减少已知的知识,则该操作不可避免地增加概率分布的信息熵,这将导致概率分布向正态分布靠近。

             

二、正态分布还有更多令人着迷的数学性质

https://www.global-sci.org/intro/article_detail/mc/11639.html

https://www.global-sci.org/intro/articles_list/mc/1412.html

             

   * 二项分布 B(n, p) 在n 很大时逼近正态分布 N(np,np(1 - p))

   * 泊松分布 Poisson(λ) 在λ 较大时逼近正态分布 N(λ, λ)

   * χ2(n) 在n 很大的时候逼近正态分布 N(n, 2n)

   * t 分布在n 很大时逼近标准正态分布 N(0, 1)

   * 正态分布的共轭分布还是正态分布

   * 几乎所有的极大似然估计在样本量n 增大的时候都趋近于正态分布

   * 克拉美分解定理( 之前介绍过) :如果 X, Y 是独立的随机变量,且 SXY 是正态分布,那么 X, Y 也是正态分布

   * 如果 X, Y 独立且满足正态分布 N(μ, σ2), 那么 XY, XY 独立且同分布,而正态分布是唯一满足这一性质的概率分布

   * 对于两个正态分布 X, Y , 如果 X, Y 不相关则意味着 X,Y 独立,而正态分布是唯一满足这一性质的概率分布

             

三、[打听] 上面的性质,与正态分布的时间序列不能被预报/预测有关吗?

   在时间序列预测时,一般将剩余的残差(residual)具有正态性作为“可预测/预报 forecast/predict”的结束。

   这是为什么?

       

         

参考资料:

[1] 2024-03-07,时间序列/time series/王德辉,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=235065&Type=bkzyb&SubID=59859

   其中,Xt为时间序列;ai为常数项;εt为白噪声序列。

[2] 2022-01-20,残差/residual/彭军还,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=50636&Type=bkzyb&SubID=79654

[3] 2023-05-10,残差平方和/residual sum of squares/唐炎林,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=51378&Type=bkzyb&SubID=59837

[4] 2023-03-03,残差检验法/residual checking method/杨浩,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=322986&Type=bkzyb&SubID=167923

[5] 2023-07-06,残差分析/residual analysis/崔恒建,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=497866&Type=bkzyb&SubID=220131

   ②误差正态分布;

   如果多元线性回归模型的假定成立,从理论上可以证明标准化残差相互独立且近似服从标准正态分布N(0,1)所以残差图中大约有95%的散点应随机的分布在-2到+2的带状区域里;更进一步地,约有99%散点随机分布在-3到+3的带状区域中;并且显示不出任何明显的趋势。

[6] 2023-01-05,一般线性模型/general linear model/贺建波,管荣展,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=527248&Type=bkzyb&SubID=216792

[7] 2023-12-20,回归分析/regression analysis/崔恒建,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=199999&Type=bkzyb&SubID=61708

   回归模型通常分为三大类:参数回归模型、非参数回归模型和半参数回归模型。

[8] Regression analysis. Encyclopedia of Mathematics.

https://encyclopediaofmath.org/wiki/Regression_analysis

[9] Weisstein, Eric W. "Least Squares Fitting." From MathWorld--A Wolfram Web Resource.

https://mathworld.wolfram.com/LeastSquaresFitting.html

   This approach does commonly violate the implicit assumption that the distribution of errors is normal, but often still gives acceptable results using normal equations, a pseudoinverse, etc.

[10] 靳志辉. 正态分布的前世今生(下))[J]. 数学文化, 2023, 4(2): 54-62.

https://www.global-sci.org/intro/article_detail/mc/11639.html

https://www.global-sci.org/intro/articles_list/mc/1412.html

[11] 靳志辉. 正态分布的前世今生(上)[J]. 数学文化, 2023, 4(1): 54-62.

https://www.global-sci.org/intro/article_detail/mc/11616.html

https://www.global-sci.org/intro/articles_list/mc/1411.html  

[12] Normal distribution. Encyclopedia of Mathematics.

https://encyclopediaofmath.org/wiki/Normal_distribution

[13] Central limit theorem. Encyclopedia of Mathematics.

https://encyclopediaofmath.org/wiki/Central_limit_theorem

        

相关链接:

[1] 2024-04-13,[数学文化,P vs NP] 正态分布的四种推导

https://blog.sciencenet.cn/blog-107667-1429560.html

[2] 2021-07-25,[阅读笔记] 神奇的正态分布与中心极限定理

https://blog.sciencenet.cn/blog-107667-1296916.html

[3] 2021-07-27,[苦啊!] 到底为什么“正态分布随机数不能被预报?”

https://blog.sciencenet.cn/blog-107667-1297235.html

[4] 2024-03-30,[笔记,数学文化] 用清晰的思想代替盲目的计算:香农的信息熵

https://blog.sciencenet.cn/blog-107667-1427605.html

[5] 2021-02-05,[笔记] 时间序列预测里的一些“专业术语”

https://blog.sciencenet.cn/blog-107667-1270762.html

[6] 2021-06-15,[求助] 时间序列预测里的回归模型“定阶”、“样本容量”的优化方法

https://blog.sciencenet.cn/blog-107667-1291316.html

[7] 2021-07-19,[资料] 时间序列分析与预测的常用误差统计指标

https://blog.sciencenet.cn/blog-107667-1296109.html

[8] 2021-07-22,[重大困惑] 为什么正态分布随机数不能“被”预测

https://blog.sciencenet.cn/blog-107667-1296529.html

                     

感谢您的指教!

感谢您指正以上任何错误!

感谢您提供更多的相关资料!

                     

(热门)[数学文化,笔记] 正态分布的多种稳定性 +1.jpg



https://blog.sciencenet.cn/blog-107667-1458130.html

上一篇:[科普,小资料] 黏菌(多头绒泡菌)优化设计交通网
下一篇:[笔记,科普,资料] 素数 prime number 入门
收藏 IP: 202.113.11.*| 热度|

25 高宏 尤明庆 王涛 刘跃 段德龙 宁利中 刘进平 王从彦 钟炳 周忠浩 黄河宁 张学文 郑永军 池德龙 朱林 谢力 范振英 朱晓刚 孙颉 李毅伟 李斐 周少祥 杨学祥 崔锦华 陶俊波

该博文允许注册用户评论 请点击登录 评论 (12 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-14 14:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部