||
当前,人工智能的第三次复兴主要是依靠数据驱动的机器学习技术,尤其是深度学习技术。虽然机器学习技术取得了巨大成功,深度学习三剑客也因此获得了图灵奖。但是,我发现机器学习,尤其是深度学习也存在着明显的不足,把人工智能搞得非常复杂、难以理解和难以解释,与真正的人类智能似乎渐行渐远。
伟大的楚国诗人屈原在2000多年前,曾经写了一篇启文《天问》,对天地形成、日月星辰等提出了170多个问题。受此启发,我在此对机器学习提出以下九问,以期把人工智能带回模拟人类智能的初心。
1. 专一容易,通用很难?机器学习面向某一任务的数据,功能专一,离通用的人类智能越来越远。
2. 内插容易,外推却难?机器学习本质是内插,而不是外推,遇到学习过的情况或者类似的情况,效果很好。但是,如果遇到不熟悉的情况和数据,就不知所措,低级错误频频。距离触类旁通的人类智能还有不少差距。
3. 任务越多,成本越高?为了完成多种任务,需要采集越来越多的不同场景的大量数据,系统成本和复杂性将越来越高。不像我们人类,一个人可以做很多事情,多才多艺。
4. 精度虽高,难以理解?只是追求性能的提升,尤其是精度的提升,对算法可解释性要求不高,导致“知其然不知其所以然”。自动驾驶汽车的突然失控,却难以找到具体原因。
5. 拟合强大,鲁棒性弱?以深度神经网络为代表的AI算法,参数太多,存在过拟合现象。最近几年,对抗样本出现,导致计算机视觉系统“张冠李戴”,令人啼笑皆非,这表明系统的鲁棒性弱。
6. 算法创新,资本运作?数据多,设备运算能力强,团队协作能力强,AI能力就强,AI研发从以理论与算法创新为主到资本运作与团队管理为主。
7.数据依赖,常识不通?太依赖于数据,忽略常识知识和逻辑推理能力,导致出现低级失误,比如对话系统的答非所问。
8. 关注细节,忽略本质? 数据驱动为主,忽略了模型驱动和机理驱动,导致算法太复杂,太关注细节,不放过一个特征,动辄成千上万维度输入,而忽略关键特征与输入输出的本质关系。其实,影响人类深远都是一些简单的公式,没几个输入输出变量,比如牛顿-莱布尼茨提出的微积分公式、牛顿提出的万有引力公式、爱因斯坦提出的质能方程,而不是高度复杂的机器学习模型与算法。
9. 举万反一,举一反三? 大量数据的统计、归纳和学习是一种学习方式,是举千举万反一,但是距离可以举一反三的人类智能还有很大差距。
总之,我们既要重视现有机器学习技术的研究和应用,也要深刻认识到其不足与弊端,不能迷信图灵奖获得者和国际权威。如果能克服以上问题,回到模拟人类智能的初心和增强人类智能的使命,就有可能发现提出新的机器学习理论与算法,实现人工智能理论和技术的原始创新。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 09:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社