|||
吕乃基
感谢《中国软科学》,拙作“大数据与认识论”在2014年第九期刊出。以下是其中的一小部分,涉及到“知其然”和“知其所以然”的关系:
由大数据直接获得的“简约有序”或“特定的结构化数据”,提供了人类群体在宏观上的某种行为,政府和公司的领导据此比以往任何时候更轻松和直截了当做出更为有效的决策。“‘大数据’可能是许多行为科学理论,乃至于是科学理论的终结者。”《连线》杂志的前主编克里斯·安德森在2008年说:“数量庞大的数据会使人们不再需要理论,甚至不再需要科学的方法。”“大数据”用事实向人类宣告:“知其然不知其所以然”,既是电脑望尘人脑的劣势,也是电脑超越人脑的优势!然而,也正是这一点引发了诸多争议。
支持者以卡尔·波普尔推崇的科学研究方法力挺舍恩伯格:大胆预测,不断犯错,不断尝试。在大数据认识论中,就是“统计+分类-推理分析=决策”,认为这是一种更加进取的思维方式,进而是一种崭新的生活理念。需要预测贝叶斯定理中所说的先验概率,鉴于新证据的不断涌现更新先验概率进而预测结果。不断犯错,不断尝试,这或许是贝叶斯定理应用起来最容易的一个原则。或者说,一旦获得新信息,我们就应该更新自己的预测。关键在于,知其然,不必知其所以然,知道该怎么做就行;“不再强调意义的真实来源,而是强调意义如何被生产”。“真正‘懂得’大数据的公司,比如谷歌,并没有将大量时间花在构建模型上,”《信号与噪音》作者希尔写道。“这些公司每年从事数十万次实验,在真实的顾客身上测试自己的想法。”
反对者认为,舍恩伯格放弃因果关系而只考察相关性的思路,与其说是一种进步,倒不如说是一种思维紊乱。不利于下一步预测,也无法采取行动[21]。李维明确指出,大数据不提供问题的答案,特别是科学问题,答案在专家或上帝手中,不在网民的口水。真的可以止于“知其然”,而不求“知其所以然”吗?认知计算是否可以取代认知科学?人类的祖先经过长期观察发现蛙鸣与下雨往往同时发生。这样的长期观察大概也称得上是“大数据”。于是试图通过学蛙鸣来求雨。在多次失灵之后走向巫术、献祭和宗教。走向错误道路的根本原因就在于在“知其然不知其所以然”。
当然,“真正‘懂得’大数据的公司”与先民不可同日而语,在“真实顾客身上的数十万次实验”也迥异于巫术。回想上世纪中叶,鲍林等人面对复杂的DNA结构由传统的先分析后综合的方法一筹莫展时,富兰克林由x-衍射,不经传统道路而直接获得DNA整体的照片,华生与克里克由此破译了DNA的双螺旋结构。大数据与此有异曲同工之妙,开辟了人文社会科学领域居高临下在整体上把握对象的认识道路,为看待人类和社会提供了一种全新的方法,“可以跳过个体认识直接到共性认识阶段,”决策行为将日益基于数据分析做出,而不是像过去更多凭借经验和直觉做出(百度百科)。它最大的价值是给我们一个“高处视角”(Top sight),允许我们以前所未有的丰富细节与深度,观察和跟踪真实世界。”然而,依然可以追问的是,双螺旋结构最终得到科学解释,大数据认识论是否也需要在知其然之后再走一步?“放弃对因果性的追求,就是放弃了人类凌驾于计算机之上的智力优势,是人类自身的放纵和堕落。如果未来某一天机器和计算完全接管了这个世界,那么这种放弃就是末日之始”。
博主已经另就“知其然”和“知其所以然”的关系写了不“知其所以然”之二不“知其所以然”1,“之三”尚在筹措之中。不过近日又想起另外的事项:
中医,数千年来维系中华民族的生存和繁衍,人口不断增长。虽然也有偏差和失误,但治愈的案例应该远大于负面案例。这是不是大数据?一定要有“科学依据”?针灸,已经走出国门,漂洋过海。一定要找到与经络和穴位对应的实体?参见“中医药的地位——知识的视角”。
若再推而广之,还有星座、血型二者与人的性格的关系。迄今为止,我们被告知的是,这纯属无稽之谈,甚至迷信,反正没有科学依据。
然而,问及周围各色人等,只要对这些“无稽之谈”略有所知者,可以说十个人中有十个会这样告诉你:“真是准!我的性格正是这样。”有些人的星座和血型所指向的性格特征可能彼此抵消而不明显,有些人则相互叠加,使某种性格特征更为突出,博主就属后者,结果是某种性格的平方!
这些说法流传既广且久,民间有大量案例。
这是不是大数据?这样的大数据是否一定要有“科学依据”?
然而反过来,近代以来,人类在科学依据的相伴之下,短短几个世纪便取得了如此成果,扭转了多少荒谬迷信,清除了几多乱力怪神。在大数据到来之际,科学依据,难道真的要成为历史?
博主无意宣扬迷信,只是提出问题。各位的评论若围绕问题本身展开,则博主幸甚。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 14:52
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社