|||
数据分析是科学研究中必不可少的环节,往往会花费科研人员大量的时间。对于单一的研究者而言,他们往往已经具备一套属于自己的分析思路和分析手段。我也一样,在跟随博导进行研究的过程中,无形中也固定了几个常用的数据分析方法,如ANOVA、GLMM、SEM、CCA、NMDS、BPNET等。然而,在过去分析数据时,我常常不断重复的相同的工作来分析的数据。前些日子,R学习交流群的小陈的一句话提醒了我似乎应该在研究之处就多做点什么。他说话的内容大意是这样——“许多课题组写文章用的研究方法都是固定了,只是换了数据而已”。
的确,在过去许多次的数据分析中,我不断地重复着许多相同的环节,我也尽力寻找能“多步化一”的方法,如构建arcgis的模型工具、保存自己编写的代码等。但是,我更喜欢将数据导入SPSS进行快速分析,因为这样,我就不用担心代码写错了。在编写代码时,可能只是简单‘,’或‘;’就会让一大串代码失效,更有那令人头痛的数值类型间的转换,甚至是在交互使用matlb和R时,就常常将‘clc’输入到R的界面。
我是一个急性子,对于静下心来调试和修正各个参数,总感觉是在浪费时间;而且我还具有强迫症和完美主义,对于调试参数总会浪费比其他人更多的时间。以R画图为例,虽然我喜欢R,它很灵活,也很快捷,各种函数包也极大地方便了编程,对于精心调写参数画出的图,虽然感觉还不错,但到头来自己根本不会用,只是作为一种参考,或最多拿去QQ空间晒一下,画图最后依然改用了sigmaplot或origin进行重做。不仅如此,有时候,不想乱改以前的代码,在后面继续写,重复的不能再重复,最后都搞不清楚需要那一条代码了,去查找保存的资料还不如重新写来的快些。这些浪费时间的例子已经数不胜数了。所以,我更希望分析的数据能想SPSS一样点两下就出现了,甚至只要点一下。不得不说SPSS的AMOS一类的工程界面我太喜欢,又简单又快。虽然MATLAB以及工程计算上也有这样的软件,但是我并不涉及,所以我还是支持这种界面。
这里不得不说,自己很矛盾,明明SPSS已经可以看到结果了,却依然想用其他的软件跑跑。这点我现在也没有想明白。
所以,我希望自己心中的所有分析模式都能一步实现,可以节约更多的时间。对于半吊子的我,可能也会是花掉更多的时间。不管怎样,我还是决定尝试一下。
在学习了那么多软件之后,我依然觉得R是我编程的最爱,可惜它没有像MATLAB的GUI开发界面,最终我依然选择回到MATLAB。R和MATLAB的交互使用使我发现一个过去固有的误区——"matlab比较正规,代码不能修改",而实际上,MATLAB可以像R一样调整各种代码。这才恍然大悟:原来无论是R、MATLAB、C、C++、VB、Java、pyton或其他,它们都是非常灵活的,一般需要的编程的软件都可以灵活掌握,能编程的软件都很强大,所以SPSS也不得不开发编程界面。因此,什么语言已经不重要了,重要的是什么语言在我的数据分析中具有更高的可信度和可实现性。MATLAB的GUI界面,毫无疑问成为了我不二的选择。
利用MATLAB设计的GUI界面可以编译成exe文件,可以在任何有MATLAB语言环境的条件下使用,而这MATLAB的语言环境也就三四百兆,自己设计GUI也就十多二十兆一个,如果自己以后有很多固定工具了,再单独设计一个主界面不就OK了。想着想着,未来的道路是一片光明。。。
总结:文献需要管理,数据也需要管理。而在我看来,打造自己的专属软件,是实现自己原始数据科学管理的一种有效手段。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-13 01:44
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社