求真分享 http://blog.sciencenet.cn/u/zlyang 求真务实

博文

敬请慎重使用和看待“数据统计与分析”的结果

已有 3976 次阅读 2020-6-17 13:30 |个人分类:风电功率预测|系统分类:科研笔记| How, Lie, with, Statistics, How, How, How, How, How, How, How

一切真理开始时总是在少数人手里,总是受到大多数人的压力。这是一个规律。

为我国2070年开始的诺贝尔科学奖“井喷”清除障碍、铺平道路!

客观规律是客观的;独立于人而客观存在。

                                        

敬请重使和看待“数据统计与分析”的结果

              

一、统计学陷阱,由来已久

   1954年,在《数理统计学》还是个大约 15岁的小青年时,Darrell Huff 博士就发现了《统计数字会撒谎,统计陷阱,How to Lie with Statistics》。

   《统计数字会撒谎,统计陷阱,How to Lie with Statistics》,the best-selling statistics book of the second half of the twentieth century. 这本书是20世纪下半叶的畅销书。

  “本书是一本如何利用统计以达到瞒天过海目的的入门读物。看上去,它很像骗子的行骗指南。但毕竟,骗子早就掌握了行骗的技巧,而诚实的人出于自卫也应该学会它。” 


《统计数字会撒谎,统计陷阱,How to Lie with Statistics》的封面

https://book.douban.com/subject/1761370/

          

二、一些数理统计学专业性的参考观点

(1)陈希孺院士

http://casad.cas.cn/sourcedb_ad_cas/zw2/ysxx/ygysmd/200906/t20090624_1810233.html


          

   最有可能的前途或许是:数据分析不大可能发展成一门符合现今数学分支严格性标准的那种“硬”科学分支,而会以一个其领域没有明确界定的实体而存在,……

上面截图和引用的文字,请看:陈希孺院士,1998,《数理统计学简史》第276页。

        

(2)王兆军老师

   统计与数据科学学院党总支书记、执行院长,统计研究院院长  

   https://stat.nankai.edu.cn/8030/list.htm

下面哪个统计学的分析结果是真的?

wzj2222222222.jpg

王兆军老师讲座截图红色文字经过隐匿性修改)。

           

三、可供参考的一些具体方法

   复杂问题的分析,需要“定性和定量”结合的方法,充分使用人类的“左脑和右脑”。

           

   数据分析的结果,建议和以下信息对照:

   1)已知的科学和技术原理、知识,等;

   (2)典型的重大历史事件、案例的分析结果;

   (3)可信的专家主观经验和感受;

   ……

   

   认识客观世界,是个永无止境的过程。

   回到华罗庚:早发表,晚评价。

        

推荐阅读:

[1] 武夷山,2015-01-23,“大概近似正确”的评价 精选

http://blog.sciencenet.cn/blog-1557-861961.html

   第三,理论自身可能有错误。例如,科学计量学领域的作者同被引分析早在20世纪70年代已现端倪,同被引分析的一个步骤是测度相似性,人们曾用皮尔逊相关系数来测度相似性,而直到2003年,人们才指出这是错误的。

   第四,算法出错。引文只是质量的替代指标,而人们经常用引文指标作为评价算法的输出变量,有时候就会得出错误的结果,比如,Bouyssou & Marchant于2011发表的文章, Waltman & van Eck于 2012年发表的文章,都指出了h指数的一些问题。

[2] 中国科学报,2020-06-16 第5版 大学周刊,盲目推崇论文引用率后果严重

http://news.sciencenet.cn/sbhtmlnews/2020/6/355871.shtm

   以论文引用率来评判论文水平的“高低”,最大的问题是极易扼杀原始创新,令原创夭折。

   原始创新、高深理论成果论文,一开始“曲高和寡”很正常,而且还有可能因其思想独特、超前而受到排斥。1979年诺贝尔物理学奖得主谢尔顿来华访问时提到,他的那篇1961年发表并获得诺贝尔奖的重要论文,发表后好些年几乎没什么引用,而且在开始被引用的时候也并不完全是正面的。像这种获得诺贝尔奖的论文在获得诺奖前引用次数很低的情况并不少见。

[3] 孙小淳,2013-10-06,苏联专家谈中国的“科学文化”

http://blog.sciencenet.cn/blog-1051670-730496.html

http://blog.sciencenet.cn/blog-107667-945476.html

   米·阿·克拉契柯教授,化学博士,1925年毕业于基辅工业大学,苏联科学院普通与有机化学研究所研究员,1948年获斯大林奖。

   “在科学作品方面,数量指标起不了特别的作用,无论如何也起不了决定性的作用,对每一个科学作品来说,最主要的是质量,也就是向自然界提出的问题的回答充分程度如何和所得答案的可靠程度如何。

                      

相关背景:

   在1930年代数学界,才实现了概率论的成熟体系(1921年J. M. Keynes的“主观概率学派”,1928年 von Mises的“客观概率学派”,1933年以柯尔莫哥洛夫的“以测度论为基础的概率公理化体系”);

   到1930年代末期,以 Student(William Sealy Gosset)、费歇尔(Sir Ronald Aylmer Fisher)、爱根·皮尔逊(Egon Sharpe Pearson)和奈曼(Jerzy Neyman)为主将,才使得数理统计学成为一个符合现代数学严格标准的学科。

相关链接:

[1] 2019-01-05,[随想] 量化评价,是对人类智力的侮辱?

http://blog.sciencenet.cn/blog-107667-1155462.html

[2] 2016-10-02,量化评价 ≈ 杀头便冠?

http://blog.sciencenet.cn/blog-107667-1006277.html

[3] 2015-12-23,[请教] 孙小淳老师《 苏联专家谈中国的“科学文化”》的真实性

http://blog.sciencenet.cn/blog-107667-945476.html

            

感谢您的指教!

感谢您指正以上任何错误!

感谢您提供更多的相关资料!



https://blog.sciencenet.cn/blog-107667-1238236.html

上一篇:出版纸质《文明火花淘金》的建议(要点)
下一篇:[资源] “数字孪生 Digital Twin”的一些参考文献
收藏 IP: 202.113.11.*| 热度|

13 郑永军 范振英 杨学祥 许培扬 尤明庆 蒋德明 曾杰 段含明 宁利中 张忆文 周忠浩 黄河宁 谢钢

发表评论 评论 (24 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 20:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部