博文

"从0到1”基础研究: 从人工智能三盘棋说起精选

已有 19288 次阅读 2020-3-11 11:34 |个人分类:从0到1|系统分类:观点评述

“从0到1”基础研究: 从人工智能三盘棋说起

国家科技部、国家发改委、国家教育部、中科院和国家自然科学基金委等五部门于3月3日联合发文《加强“从0到1”基础研究工作方案》，提出了很多切实可行的举措以加强“从0到1”的原创性基础研究，以鼓励我国科学家，尤其是青年科学家，开辟新领域、提出新理论、发展新方法，取得重大开创性的原始创新成果，抢占国际科技竞争的制高点。该方案出现得非常及时，是“破除四唯”的组合拳之一，是广大从事基础研究的科研人员，尤其是青年科研人员的“福音”。

由于该方案是全国性纲领性文件，以宏观原则和总体思路为主。针对每个具体学科，还需要具体问题具体分析，提出相应的对策。本文从现在热门的人工智能（AI）学科的发展，试图总结如何实现“从0到1”基础研究的一些具体的规律。人工智能自从1956年提出以来，其发展里程并非一帆风顺，也看不到今天的如日中天，走过的道路非常曲折，经历了三落三起。在每一次即将衰落之际，恰巧有一个大专家（团队）临危受命，以一盘棋挽狂澜于既倒，扶大厦之将倾。人生如棋局局新，幸亏棋局AI终复兴。

第一盘棋，是IBM的萨缪尔（Arthur Lee Samuel）研制的西洋跳棋AI程序，在1962年击败了当时全美西洋棋冠军，引起了巨大的轰动。这个AI程序采用了机器学习中的强化学习技术，具有自学习能力，能不断提高弈棋水平。萨缪尔参加了人工智能起点的1956年达特茅斯会议，是AI的创始人之一。他提出了“机器学习”的概念：让机器在学习中不断提高性能，并在跳棋程序中进行了实现。因此，一个AI跳棋程序，实现了2个“从0到1”基础研究：机器学习和强化学习，直到今天还影响深远。据说萨缪尔研究和完善这个程序化了约10年的功夫，做到了十年磨一剑。

跳棋AI程序把AI从谷底拉起，使得AI名声大振，让更多研究者获得更多的支持。但是，跳棋游戏还是有些简单，复杂度不高。之后，虽然有80年代神经网络的兴起，但是毕竟解决的都是些简单的问题（Toy Problem），大家慢慢对人工智能又失去了兴趣。此时，急需AI解决一个高难度的问题以重振士气。

国际象棋比跳棋复杂得多，国际象棋大师是人类智慧的杰出代表。从读博士期间，就专注计算机下棋的许峰雄博士，在IBM公司的支持下，花费约12年时间，终于研发出国际象棋AI程序深蓝（Deep Blue），具有超级运算，快速推理和搜索能力。在1997年5月12日，深蓝击败了棋王卡斯帕罗夫。当时虽然没有移动互联网，也有数以亿计的观众观看了现场直播，基本实现了AI家喻户晓，也再一次挽救了无数AI研究者和研究项目。深蓝也有2个“0到1”基础研究： 1. 将通用处理器和象棋加速芯片相结合，极大地提高了计算和搜索速度；2）汇聚了诸多人类国际象棋大师的知识与智慧，形成了超级专家系统。

在此之后，人工智能的研究又平稳发展了一段时间。虽然在2012年，深度卷积神经网络技术，使得图像识别的精度大幅度提高。但是，图像识别还局限于人工智能很小的领域，知道的人不太多，在社会上反响不大。与此同时，人工智能的热度也在逐渐下降。如果任其发展，人工智能有可能再此跌入谷底。这个时候，AI急需一场更大的胜利来鼓舞人心。

围棋是最复杂的棋类，复杂度远超国际象棋，围棋大师是人类智慧的最高代表之一。 AlphaGo是由谷歌（Google）旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。2016年3月，在数十亿互联网观众的围观下，AlphaGo以4：1战胜了世界围棋冠军李世石，终于引爆了人工智能，使之家喻户晓，妇孺皆知。AlphaGO实现了2个“从0到1“基础研究突破：1）将深度学习和强化学习完美结合，形成深度强化学习核心算法；2）将蒙特卡洛方法与深度强化学习有机结合，快速找到超级复杂问题的次优解。

从这三盘棋，我总结人工智能研究“从0到1“基础研究有三个具体思路。首先，AI研究要挑战各种人类冠军，比如中国象棋冠军，世界桥牌冠军和各类游戏冠军等等。各类人形机器人要与人类选手同场竞技，比如与博尔特比短跑，与费德勒比网球 等等。其次，要公开进行比赛，现场直播，尤其要网上直播，形成社会热点。AI研究水平，是骡子是马要牵出来溜溜。论文中的结果与仿真中的结果可信度不行，不太靠谱。必须要真刀真枪的公开比试，类似于我国古代的登台打擂。最后，要实现相互比赛，看谁家能独领风骚，一览众山小。比如，谁研究的围棋程序能击败谷歌公司的AlphaGO，我们就承认他的AI研究水平达到了世界领先水平。

转载本文请联系原作者获取授权，同时请注明本文来自陈德旺科学网博客。
链接地址：https://blog.sciencenet.cn/blog-57940-1222939.html

上一篇：博士生招生：从十八罗汉到十万大军
下一篇：“从0到1”基础研究: 从辩证唯物主义三大规律说起

收藏 IP: 110.84.185.*| 热度|

dwchen的个人博客分享 http://blog.sciencenet.cn/u/dwchen

博文

"从0到1”基础研究: 从人工智能三盘棋说起精选

“从0到1”基础研究: 从人工智能三盘棋说起

当前推荐数：23 推荐人：郑永军 曾杰 刘钢 王从彦 武夷山 杨正瓴 刘浔江 曹俊兴 姬扬 王安良 晏成和 赵志宏 李剑超 许培扬 黄永义 文克玲 周忠浩 高友鹤 施树明 周小洁 田灿荣 马德义 吴国林

该博文允许注册用户评论请点击登录评论 (38 个评论)

陈德旺

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

dwchen的个人博客分享 http://blog.sciencenet.cn/u/dwchen

博文

"从0到1”基础研究: 从人工智能三盘棋说起 精选

“从0到1”基础研究: 从人工智能三盘棋说起

当前推荐数：23 推荐人： 郑永军 曾杰 刘钢 王从彦 武夷山 杨正瓴 刘浔江 曹俊兴 姬扬 王安良 晏成和 赵志宏 李剑超 许培扬 黄永义 文克玲 周忠浩 高友鹤 施树明 周小洁 田灿荣 马德义 吴国林

该博文允许注册用户评论 请点击登录 评论 (38 个评论)

陈德旺

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

"从0到1”基础研究: 从人工智能三盘棋说起精选

当前推荐数：23 推荐人：郑永军曾杰刘钢王从彦武夷山杨正瓴刘浔江曹俊兴姬扬王安良晏成和赵志宏李剑超许培扬黄永义文克玲周忠浩高友鹤施树明周小洁田灿荣马德义吴国林

该博文允许注册用户评论请点击登录评论 (38 个评论)