闵应骅的博客分享 http://blog.sciencenet.cn/u/ymin 一位IEEE终身Fellow对信息科学及其发展的看法

博文

统计分析 无处不在(091110)

已有 4340 次阅读 2009-11-9 15:03 |个人分类:杂谈|系统分类:科普集锦| 统计, GDP, 正态分布

统计分析 无处不在(091110)
闵应骅
    对于纳米集成电路,线宽可能只有4个原子。多一个或少一个原子,误差就是20-25%。所以,生产过程的变差必须考虑。而这种变差是随机的。随机的东西也有规律,那就是概率。概率是波内尔集上的一种测度,它有很严格的理论基础。一个随机变量可以有分布,也可以没有分布。最简单而直观的分布是正态分布,其密度函数对称地分布在均值的两边,均值和方差两个参数就可以完全地表征它。大数定律表明,许多微小的相互独立的因素影响该随机变量,它就可能是正态分布。但是,许多随机变量并不是正态分布的。而且,可以解析表达的分布函数并不多。而统计分析恰恰是基于概率论的,而且大多是基于假设母体是服从正态分布的。但常常不加声明。
    统计分析在自然科学和技术领域得到广泛应用,在社会科学中更是无处不在。你打开报纸,上面几乎所有的数字都是统计出来的。就拿GDP来说,这是出现频率很高的字眼,也是大家最关心的。我们来看看GDP的定义。GDP(gross domestic product)即国内生产总值。一般认为,
             GDP = 个人消费 + 投资总额 + 政府支出 + (出口-进口)
这些参数,没有一个是绝对准确的,都是统计出来的。统计就很有学问了。
    统计是一门学问,理论、方法很多。但是,我们一般做统计要经过四个基本步骤,即设计、搜集资料、整理资料和分析资料。其中采集样本是最关键的一步,采多少样,到哪里去采样。在社会、经济领域,就是找多少人采样、找一些什么人做采样,可能结果就完全不同。譬如说,电视剧的收视率、某一个电视栏目的收视率,常常很快就可以出来,我不知道他们是怎么采样的。找多少人可以得出xx.x%的收视率。最近,国内一个学会做了一次学会满意度调查,出了许多统计图表,包括身份分析、职业分析、学历分析、职称分析、满意度等等,说明93%人对学会通讯表示满意。全是百分数。但是没有提供:你调查了多少人、得到多少回复?如果调查发出的问卷不够多,则没有代表性。如果回复的比例不大,说明会员对你的调查兴趣不大。就像各国总统选举,一定要说明,投票率是多少,太少了不行。在统计设计阶段,关键是要确定这次统计的目的是什么。统计的目的应该是为了了解客观情况,而不是为自己的某一种观点做注解、做证明,甚至是先有预期的统计结果,再去做统计。
    统计既是一门学问,也是适用价值很高的技术,统计分析则更是与社会科学、经济学等紧密相关。在美国,学数学、理论物理的人很难到找工作,而学统计的人,工作很好找。我国现在各行各业都在运用统计分析,用数字说话。这比空话、大话好得多。但是,统计过程看来需要更加透明。那样就会更有说服力。

https://blog.sciencenet.cn/blog-290937-269723.html

上一篇:科研管理的公务(091102)
下一篇:一个可信计算系列国际会议PRDC(091122)
收藏 IP: .*| 热度|

1 宋和平

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-23 14:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部