陈孝良的个人专栏分享 http://blog.sciencenet.cn/u/brygid 谈谈声学,聊聊智能

博文

谷歌DeepMind的来龙去脉 精选

已有 6871 次阅读 2016-2-5 17:18 |系统分类:科研笔记| 人工智能

近几日人工智能非常热闹,谷歌的Deep Mind人工智能团队在世界权威科学学术杂志《Nature》刊登论文,宣布旗下的Alpha Go人工智能围棋程序击败了欧洲冠军职业围棋二段樊麾(樊麾出生于中国,目前是法国国家围棋队总教练,已连续三年夺得欧洲围棋冠军)。其实,Alpha Go人工智能围棋程序也击败了目前同类优秀的围棋程序中99.8%的对手。


谷歌的Alpha Go人工智能围棋程序基于DeepMind技术,而DeepMind技术着重于深度学习和强化学习,并且能够使得机器实现自主学习。DeepMind并不是谷歌自己创建的,而是,其联合创始人Larry在2014年初以4亿美元收购的一家英国人工智能公司所创建的。DeepMind的创始人是Demis Hassabis,这可是一位计算机天才,但是,很少有人听说过 DeepMind和这位天才。直到现在网上疯炒的各家媒体,依然还是展望人工智能的前景,很少有报道这位天才以及这家公司,也难怪,这真是一家非常低调的公司。


另外,DeepMind 的投资人之一可是大名鼎鼎的 Elon Musk,就是 Tesla 和 Space X的老板,这位牛人向 DeepMind 投资了 650 万美元。谷歌收购的过程也非常有趣,其联合创始人Larry在飞机上听说了这个公司,非常感兴趣。恰巧,Facebook的创始人Mark Zuckerberg也同时对这个小公司产生了兴趣。所以,谷歌收购的过程很漫长,不过最终还是早出手的Larry胜出,这点让Zuckerberg如今仍耿耿于怀。


再来看看DeepMind 的核心技术。现在街头巷尾都在谈论的机器学习,其实这是一个非常宽泛的概念,而其中最酷的分支要算是深度学习(Deeplearning)和强化学习(Reinforcement learning)。深度学习说过多次了,可以参考声学在线以前的文章。强化学习,其实就是一个连续决策的过程,其特点是不给任何数据做标注,仅仅提供一个回报函数,这个回报函数决定当前状态得到什么样的结果(比如“好”还是“坏”), 从数学本质上来看,还是一个马尔科夫决策过程。强化学习最终目的是让决策过程中整体的回报函数期望最优。谷歌的DeepMind就将深度学习和强化学习两者的精髓合二为一,提出了深度强化学习。2014年,这个团队就在《自然》杂志发表了Human-level control through deep reinforcement learning的论文,让业界对此充满了期待。


今年三月,Alpha Go将挑战世界顶级围棋高手李世石。樊麾的世界排名是633名,而李世石的排名是第5名。许多专家认为Alpha Go将赢得这场重量级的比赛。如果的确如此,那么AI爆发是否就此拉开序幕,让我们拭目以待!


声学在线:知识,趣味,圈子

网站:soundonline.org

微信: 搜索“声学在线”

qrcode_for_gh_2cf338f6c93e_258(1).jpg




https://blog.sciencenet.cn/blog-1375795-954669.html

上一篇:苹果为什么总想取消3.5MM耳机接口?
下一篇:人类可以“听到”的引力波
收藏 IP: 124.16.131.*| 热度|

4 姬扬 薛宇 强涛 yangb919

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 19:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部