求真分享 http://blog.sciencenet.cn/u/zlyang 求真务实

博文

[打听,数理统计,概率] 将累积分布函数表示成均值、方差、偏度、峰度等的显式数学公式

已有 2510 次阅读 2024-3-3 22:50 |个人分类:先进的信息理论与技术|系统分类:科研笔记

[打听,数理统计,概率] 将累积分布函数表示成均值、方差、偏度、峰度等的显式数学公式

                                                                      

累积分布函数 cumulative distribution function

偏度 skewness

峰度 kurtosis

显式公式 explicit formula

数理统计 mathematical statistics

概率 probability

样本 sample

                                         

   下面的请教问题来自实际问题的需求(数据处理),因此混用《概率论》、《数理统计学》等里面的术语。只能今后陆续将它们严密化。

   实际问题中,几乎总是含有“噪声”、“错误数据”等非理想因素。请您适度注意下面所请教的方法,在未来实际中拟使用时的这些前提。

                                                       

   在数学的《概率论》里,已知连续型随机变量的概率密度函数( probability density function, pdf ),通过积分可以得到它的累积分布函数(分布函数, cumulative distribution function, cdf )。

   直观地,

   由“样本”的统计“直方图 histogram”,也容易得到其“足够精确的”累积分布函数 cdf。

某班学生每周学习《统计学》时间的频率直方图.png

图1  某班学生每周学习《统计学》时间的频率直方图

https://www.zgbk.com/ecph/words?SiteID=1&ID=219664&Type=bkzyb&SubID=59824

                                    

   反过来,

                                                                                      

一、累积分布函数 cdf 可以表示成均值、方差、偏度、峰度等的显式数学公式吗?

   已知该连续型随机变量的均值、方差、偏度( skewness )、峰度( kurtosis ),

   (1)是否可以依据这些统计量,写出该连续型随机变量的“近似”的显式累积分布函数 cdf ?

   (2)这个“近似”的显式累积分布函数 cdf ,与精确的 cdf 之间的误差有多大?

                          

   例如:伽马分布族(gamma distribution)的“偏度”仅取决于其“形状参数 α”;与其“尺度参数 β”无关。

https://www.zgbk.com/ecph/words?SiteID=1&ID=231922&Type=bkzyb&SubID=59833

                    

   伽马分布族(gamma distribution)的均值(mean)、方差(variance)、偏度(skewness)、峰度(kurtosis excess)的计算公式为:

mean variance skewness kurtosis (Wolfram MathWorld) Gamma Distribution.jpg

https://mathworld.wolfram.com/GammaDistribution.html

                                                               

二、累积分布函数 cdf 可以表示成“样本矩”、“k阶样本中心矩”的显式数学公式吗?

   ?

                                         

   以上,优先考虑“简单”的显式公式(explicit formula),如简单的多项式函数(polynomial function)之类。

   所求教的这些显式公式的目的是用于工程实际问题:简单性第一,准确性第二。

   “只求最快,不求最准。

                                  

参考资料:

[1] 2023-10-18,样本/sample/金勇进、蒋妍,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=237881&Type=bkzyb&SubID=173892

[2] 2023-06-26,直方图/histogram/王会娟,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=219664&Type=bkzyb&SubID=59824

[3] 2022-12-23,样本矩/sample moment/柏杨,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=192542&Type=bkzyb&SubID=61704

[4] 2022-12-23,k阶样本中心矩/sample central moment of order k/周洁,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=231690&Type=bkzyb&SubID=59831

[5] 2023-03-01,数据类型统计描述/statistical description of data type/吴海龙,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=18617&Type=bkzyb&SubID=62230

[6] 2023-12-11,描述统计/descriptive statistics/刘扬,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=51181&Type=bkzyb&SubID=59823

[7] 2023-06-21,气象统计学/climatological statistics/封国林,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=409070&Type=bkzyb&SubID=198711

[8] 2023-04-12,偏度系数/skewness coefficient/尹平,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=94939&Type=bkzyb&SubID=124955

[9] 2022-12-23,样本偏度系数/sample skewness/周洁,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=231687&Type=bkzyb&SubID=59831

[10] 2023-05-09,Gamma分布族/gamma distribution/钟威,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=231922&Type=bkzyb&SubID=59833

[11] 2023-12-12,峰度系数/coefficient of kurtosis/关蓉,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=51209&Type=bkzyb&SubID=59824

[12] 2023-12-23,样本峰度系数/sample kurtosis/周洁,中国大百科全书,第三版网络版[DB/OL]

https://www.zgbk.com/ecph/words?SiteID=1&ID=231686&Type=bkzyb&SubID=59831

[13] Weisstein, Eric W. "Mean." From MathWorld--A Wolfram Web Resource.

https://mathworld.wolfram.com/Mean.html

[14] Weisstein, Eric W. "Variance." From MathWorld--A Wolfram Web Resource

https://mathworld.wolfram.com/Variance.html

[15] Weisstein, Eric W. "Skewness." From MathWorld--A Wolfram Web Resource

https://mathworld.wolfram.com/Skewness.html

[16] Weisstein, Eric W. "Kurtosis Excess." From MathWorld--A Wolfram Web Resource.

https://mathworld.wolfram.com/KurtosisExcess.html

[17] Weisstein, Eric W. "Gamma Distribution." From MathWorld--A Wolfram Web Resource.

https://mathworld.wolfram.com/GammaDistribution.html

[18] Gamma-distribution. Encyclopedia of Mathematics.

https://encyclopediaofmath.org/wiki/Gamma-distribution  

[19] 6. Gamma Function and Related Functions, Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables (Partially Mathcad-enabled), 1972

https://app.knovel.com/web/view/khtml/show.v/rcid:kpHMFFGMT1/cid:kt00A81K71/viewerType:khtml//root_slug:handbook-mathematical/url_slug:gamma-function-related?b-q=Gamma%20Function&include_synonyms=no&s_page_no=0&sort_on=default&view=collapsed&zoom=1&page=1&q=Gamma%20Function

                                 

我们以前的同类学术期刊论文:

[1] Zhengling Yang, Zhifeng Duan, Jingjing Wang, Teng Wang, Yanwen Song, Jun Zhang. Quadratic radical function better than Fisher z transformation [J]. Transactions of Tianjin University, 2013, 19(5): 381–384.

doi:  10.1007/s12209-013-1978-8

https://link.springer.com/article/10.1007/s12209-013-1978-8

[2] Zheng-Ling Yang, Yan-Wen Song, Zhi-Feng Duan, Teng Wang, Jun Zhang. New Sigmoid-like function better than Fisher z transformation [J]. Communications in Statistics - Theory and Methods, 2016, 45(8): 2332-2341.

doi:  10.1080/03610926.2013.771750

https://www.tandfonline.com/doi/abs/10.1080/03610926.2013.771750?journalCode=lsta20

[3] 王晶晶, 杨正瓴. 累积正态分布函数的逼近函数综述[J]. 计算机应用, 2014, 34(S2): 83-84, 90.

doi:  1001-9081( 2014) S2-0083-02

http://www.cqvip.com/QK/94832X/2014A02/663296953.html

https://d.wanfangdata.com.cn/conference/8501053

                            

相关链接:

[1] 2022-06-22,[小结] 我们在概率论、数理统计学方面的主要创新点(和应用)

https://blog.sciencenet.cn/blog-107667-1344083.html

[2] 2021-07-19,[资料] 时间序列分析与预测的常用误差统计指标

https://blog.sciencenet.cn/blog-107667-1296109.html

[3] 2020-08-18,没有真正“小样本”数理统计学的世界,了无生趣

https://blog.sciencenet.cn/blog-107667-1246844.html

[4] 2018-08-18,“大数据”时期,更渴望“小样本数理统计学”

https://blog.sciencenet.cn/blog-107667-1129894.html

[5] 2020-03-26,现实中常见的概率分布

https://blog.sciencenet.cn/blog-107667-1225390.html

[6] 2014-03-04,[请教] 相关系数和互信息之间的解析关系

https://blog.sciencenet.cn/blog-107667-773091.html

[7] 2017-03-01,[资源] 数学百科全书和手册

https://blog.sciencenet.cn/blog-107667-1036897.html

         

[8] 2023-04-05,[讨论,擂台] 比真随机数更好的伪随机数(以[0,1] 区间上的均匀分布随机数为例)

https://blog.sciencenet.cn/blog-107667-1383089.html

[9] 2023-03-31,[小资料,擂台] 随机数,伪随机数,真随机数

https://blog.sciencenet.cn/blog-107667-1382520.html

[10] 2021-01-30,[再擂台] 最好的100个均匀分布随机数 The best 100 uniformly distributed random numbers

https://blog.sciencenet.cn/blog-107667-1269740.html

[11] 2021-01-30,100个均匀分布随机数 100 uniformly distributed random numbers

http://blog.sciencenet.cn/blog-107667-1269737.html

[12] 2021-05-10,“最好的均匀分布随机数”的一些说明

https://blog.sciencenet.cn/blog-107667-1285904.html

[13] An explicit analytical estimation of the validity of the Tanimoto similarity by confidence intervals in mathematical statistics [C]. Proceedings of the 2018 13th World Congress on Intelligent Control and Automation: 979-984. (EI).

https://ieeexplore.ieee.org/document/8630700/

[14] 2019-07-16,会议论文公式纠错:Tanimoto similarity 谷本系数的置信区间

http://wap.sciencenet.cn/blog-107667-1189819.html

[15] 2022-06-21,往日(11):比 Fisher Z Transformation 更好的标准正态分布累积分布erf逼近函数

https://blog.sciencenet.cn/blog-107667-1343914.html

[16] 2022-06-23,往日(11)之二:比 Fisher Z Transformation 更好:细节与相关的历史资料

https://blog.sciencenet.cn/blog-107667-1344208.html

               

感谢您的指教!

感谢您指正以上任何错误!

感谢您提供更多的相关资料!



https://blog.sciencenet.cn/blog-107667-1423961.html

上一篇:[打听] 卡塔琳·考里科(Katalin Karikó)的 mRNA : 一个来自中世纪的故事?
下一篇:[打听,数理统计,概率] 大数据里的“最简”最优子抽样方法是什么?
收藏 IP: 202.113.11.*| 热度|

15 宁利中 尤明庆 刘进平 许培扬 黄河宁 孙颉 郑永军 张学文 高宏 王成玉 杨学祥 王涛 崔锦华 谢钢 刘跃

该博文允许注册用户评论 请点击登录 评论 (9 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 00:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部