气宇轩分享 http://blog.sciencenet.cn/u/yufree

博文

所谓数据处理软件

已有 11950 次阅读 2012-9-8 15:54 |个人分类:生活点滴|系统分类:生活其它| MATLAB, 统计, EXCEL, 本科生, origin

要是猜得不错,国内本科生最先接触的图表可能就是柱形图、折线图、饼图、散点图,稍微进一步就是线性回归,明白R^2超过几个九就可以,多数大学毕业生的数据处理水平过个n年也还是停留在这个水平。到了研究生阶段就更乐呵了,不少大仙都是把excel当原始数据收集软件用(当然不少分析软件兼容excel导入也是个问题),做个线性回归就上origin、sigmaplot……统计分析更是到处求spss、sas的破解版……个别人张口闭口matlab,却也只是做做回归……我要是excel的设计者,估计先被气死再被气活然后思考下人生再来个自我了断。

先列举下excel可以做的东西,放心都不给教程,总不能让F1键当摆设吧。

线性回归
非线性回归
多元线性回归
描述性统计
单因素方差分析
双因素方差分析
假设检验(F、t、z检验)
抽样
生成随机数
傅立叶分析
规划求解(包括线性规划、非线性GRG、演化)

如果你的统计学水平能达到考研数一的水平的话,那么你就会发现excel完全可以配合你的知识来使用,够用。当然你说excel是收费的,没错,但多数高校都采购过excel,这样即便你在文章中注明使用excel也不存在问题,倒是上面提到的那些破解版不见得满大街都有卖的,随意在文中注明风险不小。要明确一点,多数数据处理软件不是免费的,但经典的算法都是公开的,所以有时候可以说我在数据处理中用了什么算法而绕开软件,其实诸如Scilab、R、freemat……等数据处理软件都是免费的,当然不是每个人都习惯那些操作界面,但前面这句纯粹胡说八道,对于对数据没概念的人学习任何一个软件都是一样的,那些看似高端的话等你实际把玩过这些软件再说吧。如我一般的穷学生,别人写好了软件让你用还懒的看quick start之类的小教程那不是高端,是虚伪。多数非计算学科的科研工作中涉及的数据处理量根本就是毛毛雨,本来用的次数就有限还挑三拣四是很无聊的,更不用说多数人的数据处理模式根本就是照着文献搬的,美其名曰工具就是这么用,根本没有基本的数据分析意识,多数的数据分析都是为了寻找原始数据或现象中的规律或验证自己的假说。

根据假设选工具,根据结果给结论,这是最基本的,文献大都默认了这一点,所有算法都有自己的适用范围,不加区别的乱用,甚至文章中都不提使用原因是很多研究工作的通病,因为有前人的文献,所以很多时候审稿人也会默认这样是可行的,但可行不代表无疑。有个思想实验叫中文房间,其中一个延伸版就是外面的人给房间中的人递中文纸条,房间里的人完全不懂中文但有一本中文百科大全,他只需要对着长得差不多的字去看这个条目对应的可回答的项目并抄下来然后传递出去就可以了,这时候外面的人自以为跟房间里交流的不错,事实上里面的那个是个水货,完全不懂中文。在今天的话题里,中文纸条就是数据处理的过程,房间里就是不少研究生的真实写照,房间外就是审稿人,那本百科全书就是文献。其实在国内,有不少审稿人自己也是搬着本百科全书在理解。也许你会说这只是一个小部分,我只要说明白了问题不必解决每个细节的合理性,但这样就完全隐藏了你自己的真实水平,出来混都是要还的,这绝不是危言耸听。我最反感两个人实际都不懂却非要讨论一个专业话题,要么就是互相吹捧,要么就是互相谩骂,不幸的是,国人在这件事上乐此不疲,很少听到有营养的讨论。

此外,也就人说excel图不漂亮,其实图表的格式都是可以自定义的,所谓的不漂亮只是默认格式不漂亮。又有人说了,默认不漂亮就是大问题,我没必要去伺候一个工具。事实上学精一个工具要强于泛泛学习多个工具,软件的设计大同小异,学通一个,一通百通。况且所谓的默认格式漂亮也只是假象,更真实的情况可能是别人只教你这样用且告诉你这样出图写文章障碍少。为了方便,很多人放弃了更重要的东西——质疑。这样做不被质疑,但反过来想,被质疑才是知识进步的方式,总是不质疑也就总是做些边边角角的研究,创新性从一开始就被实用主义打败了。结果似乎是皆大欢喜:文章发了,职称升了,工资涨了。但这样做研究跟那些白领、公务员本质上没什么不同——学识不长,人脉关系网疯涨,社交水平不断提高,自我感觉层次长了不少。

坦言之,我不反对实用主义,也不反对掌握方法比内容更重要的观点。但实用主义不能是为达目的不论手段的借口,信息时代方法固然重要,但没有内容的骨架也是毫无价值,你可以搞个智能手机天天搜索,但这不是全部。kk在《失控》里说机器在向人进化的同时人也在向着机器进化,但人永远不会成为当前的机器,看不清方向很正常,但总是看得清方向同样可怕。并不是分清了轻重缓急就一定要把重的与急得做完了而放弃轻的缓的,要知道,进化并没让我们比两万年前的判断能力改变多少,我们会犯错,更重要的是,犯错也许创造未来。

最后附上wiki上一个数据处理软件的对比列表,免费的很多哦亲!
http://en.wikipedia.org/wiki/Comparison_of_numerical_analysis_software


https://blog.sciencenet.cn/blog-430956-610498.html

上一篇:从高维诅咒到因子分析
下一篇:闽浙万里行
收藏 IP: 159.226.240.*| 热度|

2 李本先 梁钪

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 01:37

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部