diyuebao的个人博客分享 http://blog.sciencenet.cn/u/diyuebao

博文

置信区间和标准误差

已有 15686 次阅读 2015-2-28 17:16 |个人分类:统计学|系统分类:科研笔记| 置信区间

   今天看美国统计学家Iversen等人编著的由吴喜之老师等人翻译的《统计学-基本概念与方法》一书,才算是对“置信区间”一词有了一些了解,而我在此之前的理解正如书中153页举的例子中所提到的,是错误的。

   统计学的重要分支之一是统计推断,统计推断由估计与假设检验组成,估计就是通过已知的样本统计量来估计总体参数的数值,用图形表达就是通过从总体抽样出来的多个样本的分布图来估计总体的分布图。

   估计又分为“点估计”和“区间估计”,他们之间的区别作者用了一个特别易懂的例子,如果你研究平均一个美国人一生中要得到多少交通罚单,报告研究结果的方法有两种:“10个罚单”或者“8-12个罚单”,而10就是对总体均值的点估计,8-12就是对总体参数的区间估计。而区间估计又称为置信区间估计,要得到一个置信区间需要样本统计量(比如均值)和从数据中计算出的抽样误差,这里的抽样误差可以简单的理解为与标准误有关的数值,这么说是因为置信区间收到置信水平和样本分布的影响。如果是z分布,即标准整体分布,在95%置信水平下则置信区间为:均值±1.96×标准误,1.96就是z标准正态分布中覆盖95%概率面积的端点的绝对值。

   需要进一步理解的是:假设现在是95%的置信水平,每个从总体中抽出的样本都可以求出一个95%的置信区间,且不同样本求出的置信区间是不同的,但随着抽出的样本次数的增加,例如抽100次,得到100个样本,每个样本都对应一个置信区间,那么100次抽样求出的100个置信区间有95个包含真实的总体均值。换成一次抽样可以理解为:我们有95%的信心在有一次抽样得到的样本计算出的95%的置信区间内包括均值。

   总结来说,置信区间会因样本的不同而不同,而且不是所有的区间都包含真值,一个区间就像是一个为了捕获总体未知参数而撒出的网,不是所有撒网的地点都能捕获我们想要的总体的参数。





http://blog.sciencenet.cn/blog-925634-870778.html

上一篇:商品交换

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-8-5 07:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部