||
近几日人工智能非常热闹,谷歌的Deep Mind人工智能团队在世界权威科学学术杂志《Nature》刊登论文,宣布旗下的Alpha Go人工智能围棋程序击败了欧洲冠军职业围棋二段樊麾(樊麾出生于中国,目前是法国国家围棋队总教练,已连续三年夺得欧洲围棋冠军)。其实,Alpha Go人工智能围棋程序也击败了目前同类优秀的围棋程序中99.8%的对手。
谷歌的Alpha Go人工智能围棋程序基于DeepMind技术,而DeepMind技术着重于深度学习和强化学习,并且能够使得机器实现自主学习。DeepMind并不是谷歌自己创建的,而是,其联合创始人Larry在2014年初以4亿美元收购的一家英国人工智能公司所创建的。DeepMind的创始人是Demis Hassabis,这可是一位计算机天才,但是,很少有人听说过 DeepMind和这位天才。直到现在网上疯炒的各家媒体,依然还是展望人工智能的前景,很少有报道这位天才以及这家公司,也难怪,这真是一家非常低调的公司。
另外,DeepMind 的投资人之一可是大名鼎鼎的 Elon Musk,就是 Tesla 和 Space X的老板,这位牛人向 DeepMind 投资了 650 万美元。谷歌收购的过程也非常有趣,其联合创始人Larry在飞机上听说了这个公司,非常感兴趣。恰巧,Facebook的创始人Mark Zuckerberg也同时对这个小公司产生了兴趣。所以,谷歌收购的过程很漫长,不过最终还是早出手的Larry胜出,这点让Zuckerberg如今仍耿耿于怀。
再来看看DeepMind 的核心技术。现在街头巷尾都在谈论的机器学习,其实这是一个非常宽泛的概念,而其中最酷的分支要算是深度学习(Deeplearning)和强化学习(Reinforcement learning)。深度学习说过多次了,可以参考声学在线以前的文章。强化学习,其实就是一个连续决策的过程,其特点是不给任何数据做标注,仅仅提供一个回报函数,这个回报函数决定当前状态得到什么样的结果(比如“好”还是“坏”), 从数学本质上来看,还是一个马尔科夫决策过程。强化学习最终目的是让决策过程中整体的回报函数期望最优。谷歌的DeepMind就将深度学习和强化学习两者的精髓合二为一,提出了深度强化学习。2014年,这个团队就在《自然》杂志发表了Human-level control through deep reinforcement learning的论文,让业界对此充满了期待。
今年三月,Alpha Go将挑战世界顶级围棋高手李世石。樊麾的世界排名是633名,而李世石的排名是第5名。许多专家认为Alpha Go将赢得这场重量级的比赛。如果的确如此,那么AI爆发是否就此拉开序幕,让我们拭目以待!
声学在线:知识,趣味,圈子
微信: 搜索“声学在线”
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 19:56
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社