kevinatuofc的个人博客分享 http://blog.sciencenet.cn/u/kevinatuofc

博文

徒有其形而无其实?计算机科研与实践的距离 精选

已有 6598 次阅读 2013-5-22 01:34 |系统分类:海外观察| 科研, 计算机

今天读到一篇博文《A criticism of computer science: models or modèles?》,由一位来自加拿大魁北克 TéLUQ 学校计算机系教授的Daniel Lemire写成的。博文链接在这里: http://lemire.me/blog/archives/2013/05/17/a-criticism-of-computer-science-models-or-modeles/
文中提到,他在审核他们学校的一篇计算机系博士开题时,他发现该开题写得规范和“科学”:“建立模型” -> "开发系统" -> "收集使用数据" -> "选用合适的度量"。 作者觉得有点怪怪的,因为该学生的开题在理论上看似无懈可击,但即使做出来了也不会有多么振奋人心。
这样的事在计算机科学很正常。研究人员的报告写得很漂亮,观点也很清晰,但一眼看上去就知道实际用处不大(not useful)。

作者用程序员与医生对比:医生们常常要阅读科学文献,职业要求他们关注医学领域的最新进展;相比之下,有几个项目经理会关心组里的程序员阅读了几篇最新的科研文献? (当然,后文的跟贴里有人认为这种比喻不妥,因为程序员与医生职业要求不一样,程序员少一点科研知识,后果仅是程序慢一点而已;而医生如果对科学无知,那可是人命关天的,一点马虎不得,这也是为何程序员可能半路出家,非科班出身也可能胜任,而对职业医生的培训要经过五年以上的时间)
作者把原因归结于:计算机科学家用的很多模型(model)都是不实用的(useful)。(把这里的‘model’ 翻译成模型,其实有不妥,但是本人功力有限,苦于找不到更好的中文词语与之对应。作者的model一词概念很宽,并不实指某个具体的模型,我理解为model是一种思维方式,用语言表述出来就是一个 科学命题

一个理想的、严谨的科学命题应该是像这样:在数据Z上的,软件X比软件Y运行得更快Software X will be faster than software Y on data Z)。
这个命题应该是容易被证伪的,也就是如果经过实践检验,在数据Z上的,软件X比软件Y运行得慢,那么观点就会被推翻,此命题为假。
但是在很多科研论文里,我们看到的是这样的结论:根据某个(并不一定可靠的)执行速度预测模型,在数据Z上的,算法X比算法Y运行得更快(According to some cost model that may or may not be indicative of actual running speed, algorithm X is better than algorithm Y on data Z)。
作者认为,这种结论的实际意义不大,因为前提假设/限制过多,不具备普适性。但是在理论上它是无懈可击的,永远不能被现实的证据证伪。作者用了一个法语词 modèle 来形容这种思维模型,因为这种命题是经过简化的科学命题,与真正实用的科学命题相比,这些命题就像儿童的玩具一样简单、天真。
你可以将modèle 与现实对比,但是你永远不能证明modèle是错误的,因为modèle都是经过精心设计的,在逻辑上无懈可击。

modèle 的设计者其实在玩思维/逻辑或文字的游戏,modèle 并在解决实际问题,因此与现实无关。计算机科学里充斥了这种modèle !作者还联想到了一种叫做 Cargo cult science 的伪科学流派,这个流派就像未开化的原始部落,刚刚接触到现代科技产物时,他们只关注那种神乎其技的技术产品外表 (cargo),造了很多外型类似于飞机、登陆舰等等的东西进行宗教似的膜拜,并不是用一种真正的科学方法(scientific method) 来指导实践,徒有其形而无其实。


个人点评:
1. 作者对计算机科研现状的批评还是有道理的,很多科研人员做的东西实在与现实相差太远,最终所谓的学术成果其实不过一场文字游戏而已。所以,要做好研究的思路是,尽量把自己的命题往现实里靠,综合自己的联想和分析能力,努力让自己的成果对现实有指导意义。
2. 这种现状不能全怪研究人员们,他们是有苦衷的,谁不想拿到宝贵的第一手数据呢?很多时候是数据和设备是最大的颈瓶,并不是研究人员自身的科研能力。例如我所在的实验室就曾经与一家软件企业合作,想攻克他们公司中的一些难题,去一次他们公司要,坐公车来回要四小时以上,去到公司后发现很多数据都是保密的,我们根本看不到,花费了很大的心血去收集和分析那些有限的数据,到头来什么结论都得不到,没有数据就没有可能得出让人信服的结论,也就不可能发表任何文章。大家都知道这个道理。
所以,是否可以拿到数据,这往往是科研成果是否有现实指导意义的颈瓶。但在IT企业里数据都是有商业保密的,能否说服公司高管把数据透露给科研人员,这个问题已经超越了科研能力的范围之外了。
3. 根据博文后的回贴,其实其他学科也好不了多少,例如 在数学系里,经常做的是 you prove what you can prove, not what it is useful.




https://blog.sciencenet.cn/blog-934027-692223.html


下一篇:如何高效地工作——读Aaron Swartz博文有感
收藏 IP: 172.219.146.*| 热度|

1 rosejump

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 15:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部