spring63的个人博客分享 http://blog.sciencenet.cn/u/spring63

博文

机器学习正在重塑我们的世界 精选

已有 4361 次阅读 2017-7-18 06:44 |系统分类:海外观察

1

20159月,华盛顿大学计算机科学教授、国际机器学习学会创始人之一佩德罗·多明戈斯(Pedro  Domingos)出版了一本新书《The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World》。20171月中信出版集团出版了这本书的中文版,书名被译为《终极算法:机器学习和人工智能如何重塑世界》。乍一看,我对这个中文版的书名颇不以为然——向来我对网络上流行的“标题党”的极端用词很反感。后来浏览了这本书,感到这样的译名,确实反映了作者的某种追求。

在英文版出版时,多明戈斯曾经介绍他出版的新书的两个原因:其一,实际需要——机器学习是当前社会关注的话题。但是,大多数人并不真正理解这个话题。其二,统一——机器学习主要算法有五大学派:符号主义(基于逻辑学,逆向演绎)、联结主义(基于神经科学,反向传播)、进化主义(基于进化生物学,遗传编码)、贝叶斯派(基于统计学,概率推理)和行为类推主义(基于心理学,支持向量机)。作者正在思考如何努力统一各个学派,寻求形成单一通用的学习算法。

在世界顶尖的研究实验室和大学里,发明“终极”学习算法的竞赛正在开展:能够从数据中发现任何知识,并在我们还没有提出要求之前,就能够为做任何我们想做的事情的算法。在书中,多明戈斯为我们揭开面纱看谷歌、Amazon和你的智能手机里的机器学习。多明戈斯教授自己并不确定这种算法会在明天或多年后被发现,或者永远不被发现。但他确实认为,未来几年里,将看到五个学派中最好的部分被结合在一起。

2

虽然这篇博文的题目仿照了多明戈斯的这本书中文版书名的副题,但是,我们并不准备对未来是否会诞生终极算法进行预测。新技术的影响难以预测。我们重点在回顾过去十年间机器学习技术进步,并讨论机器学习正在对我们的世界发生的影响。

在过去十年间,机器学习技术最大的进步,当属联结主义学派的深度学习算法。深度学习的策略是模拟神经元,并将之组织成多个层次。例如,对于人脸识别而言,一张图片输入到深度学习系统时,系统的第一层仅简单区分其中的明暗像素点,下一层可能就将某些像素点构成了边界,再往下一层就能区别水平和垂直线条,最后一层能识别出眼睛,并且会认识到人脸中通常有的两只眼睛。许多研究人员认为,深度学习是个很好的解决方案。

2006年,计算机科学家杰夫•辛顿(Geoffrey Hinton)在《科学》杂志上发表了有关深度学习的论文。2009年,辛顿小组在语音识别领域获得突破。

2011年,谷歌的研究人员从YouTube视频中抽取了1000万张静态图片,训练谷歌大脑(谷歌大脑是一个采用深度学习技术的大型神经网络,由1000台计算机组成),在这些图片中寻找重复出现的模式。几天后,谷歌大脑在没有人类帮助的情况下,从这些图片中识别出“猫”。2012年,深度学习技术在图像识别领域取得惊人的成果,在ImageNet评测上将错误率从26%降低到15%。同年,制药公司将深度神经网络应用于药物活性预测问题取得世界范围内最好结果。这些事件被认为是深度学习技术发展的一个里程碑。

20134月,《MIT技术评论》杂志将深度学习列为2013年十大突破性技术之首。

2016315日,谷歌的人工智能程序AlphaGo41的比分打败围棋世界冠军、九段专业棋手李世石。2017527日,AlphaGo在与被称为当今世界围棋第一人的中国棋手柯洁三番围棋较量中,以30完胜。这样的结果出乎人工智能领域的专家的预料——人工智能领域的专家原认为人工智能距离对一个顶级职业球员的取胜还有10年之遥!这样的结果也使得大众折服于AlphaGo背后的人工智能机器学习技术——深度学习竟会如此厉害!更使得人工智能机器学习益发成为公众关切的焦点。AlphaGo在人机围棋大战中大获全胜,得益于深度学习算法。AlphaGo的深度学习技术架构采用的是把人工神经网络的层级大大增加,提升了计算能力。

还值得一提的是,201612MIT出版社出版了伊恩·古德费洛(IanGoodfellow)、约书亚·本吉奥(Yoshua Bengio)和艾伦·考维尔(Aaron Courville)著的《DeepLearning》一书。三位作者是深度学习领域的顶级专家。全书包含应用数学与机器学习基础、深度网络现代实践和深度网络研究三大部分。据报道,其中文版即将由人民邮电出版社出版。

除了联结主义学派深度学习算法外,其它学派也正在取得进展。例如,贝叶斯学派的概率图模型。概率图模型可追溯到朱迪雅·珀尔(Judea Pearl)在20世纪80年代发明用图来表示变量概率依赖关系的理论——结合概率论与图论的知识,利用图来表示与模型有关的变量的联合概率分布。近10年来,概率图模型成为不确定性推理的研究热点,在人工智能、机器学习和计算机视觉等领域展现了广阔的应用前景。2012年珀尔获得图灵奖,这是计算机科学领域的诺贝尔奖。2013年以来,概率图模型已经成为计算机视觉领域基本建模工具。

还值得一提的是,2009年8月MIT出版社出版了美国斯坦福大学教授科勒和以色列希伯来大学教授弗里德的专著《Probabilistic Graphical Models: Principles and Techniques》,2015年其中文版《概率图模型:原理与技术》由清华大学出版社出版。这是机器学习和人工智能领域一部里程碑式的著作,全面描述和总结概率图模型这一领域的基础知识和最新进展。

3

世界上一些最聪明的公司,开始采用人工智能机器学习技术。不久前,《MIT技术评论》的编辑挑选了50家将创新技术和有效的商业模式结合起来的公司,称为2017年最智慧的公司(50 Smartest Companies 2017),其中致力于将人工智能机器学习技术结合到其产品、服务和商业模式的公司最多。

例如,亚马逊(Amazon)公司推出的无人超市Amazon Go,使用计算机视觉、深度学习以及传感器融合等技术,颠覆了传统超市的运营模式,取消了传统的收银、结帐的过程。亚马逊还将智能语音助理Alexa扩大用到手机、汽车等,以及被预装在智能家居的控制装置内部,可以接收相应语音命令。

科大讯飞股份有限公司的实时便携式翻译机,应用人工智能机器学习,克服了方言、俚语和背景噪声问题困扰,以惊人的准确性在中文和其他十几种语言之间的翻译。据称,科大讯飞的语音技术占有中国的市场份额的70%。在过去的一年里,它推出了一些系统,使人们能够通过声音控制汽车、电视和家用电器,投资于一个制造家庭机器人的初创企业,并建立了一家合资企业,开发具有即时翻译功能的教育产品。

Alphabet公司Google的母公司)是许多新技术领域的领导者,包括:人工智能(AI)、虚拟现实(VR)和增强现实(AR)等。DeepMind部门发明了AI系统的新技术,模仿人的智能和更快速地学习。其自动驾驶汽车项目Waymo继续提高性能。Alphabet认为它可以通过帮助企业利用称为TensorFlow机器学习工具,从亚马逊夺取云计算市场。

腾讯是是世界上最大的视频游戏公司,拥有中国最大的社交网络——微信。腾讯公司的人工智能战略基于腾讯亿万用户海量数据及在互联网领域的技术优势,立志打造世界顶尖人工智能团队。腾讯人工智能实验室聚集了全球数十位人工智能科学家,专注机器学习、计算机视觉、语音识别、自然语言处理等人工智能领域的研究。

当今最流行的人工智能技术需要大量的数据来训练他们的系统。Gamalon声称其概率规划算法(probabilistic programming algorithms)更有效,因为可以只从几个例子中学习,并可以运行在iPad或笔记本电脑,而不是昂贵的服务器和图形处理器。

与其他AI初创公司不同,Kindred AI设想未来智能机器与人们一起工作,以提高两者的效率。其系统是机器人与配备VR耳机和手持运动跟踪控制器的人类“领航员pilots)”配对。机器人使用机器学习算法来操作,但如果遇到问题,如需要当抓取和放置物品到仓库中时,人类可以暂时控制,机器人将通过强化学习提高其性能。这项技术可能会导致一种新型的AI和通用机器人,能够完成多种任务。

Nvidia公司尽管仍然从销售视频游戏图形芯片赚大部分钱,但它已经确立了自己作为人工智能软件处理能力的领先供应商,其人工智能相关业务正在迅速增长。

特斯拉(Tesla)自动驾驶系统由于具备惊人的机器学习能力,用户发现它每天都在进步。

Sophia Genetics遗传基因测序技术公司),利用人工智能算法对病人的DNA序列进行排序,以便更快地诊断癌症、心脏病和其他疾病。

Face ++ ,开创了人脸识别技术的新用途,从欺诈调查到“微笑支付”。

阿里巴巴,迅速扩大其阿里巴巴云平台中的人工智能,包括特定行业的产品,并推出一个全球电子贸易平台,与世界各地的中小企业建立业务。

百度致力于人工智能的雇员人数达1300人。尽管其收入增长下降,还有一些著名的机器学习专家离开,百度仍继续向人工智能研究投资。20171月,百度推出了具有语音功能的智能助手dueros,这是类似于亚马逊的Alexa。百度为了加强无人驾驶汽车的主动性,还收购了一家计算机视觉初创公司,与有关零部件制造商签署了合作协议,并宣布计划将其自驾车的硬件和软件作为开源技术发布。尽管百度能否将这些项目商业化尚待观察,但中国政府还是选择了它来领导该国第一个全国人工智能研究实验室,以此表达了对该公司的信心。

一些老牌巨头公司,都表明了重视适应新技术,如:通用电气(General Electric)将AI(人工智能)纳入其业务,IBM探索新的技术如云AIIntel公司在计算机视觉和人工智能方面的收购等。

通用电气的大型服务业务,围绕着现有的产品,如飞机引擎、机车和燃气涡轮机,一直专注于捕捉和解释这些领域的数据。这些系统现在采用人工智能来跟踪性能,并提前预测故障。通用电气的目标是在2020之前成为全球最大的软件供应商之一。

IBM仍对持续增长的一系列新兴技术的投资,如区块链(blockchain)。在IBM的帮助下,企业客户如沃尔玛,使用区块链追踪全球供应链。新的业务包括区块链、云计算和人工智能服务,带来的收益超过2016的公司总收入的40%

英特尔得益于一系列以人工智能为中心的投资和收购,以抵消其主要市场个人电脑芯片的下降。在过去的一年,它购买了深层学习新兴企业Nervana,计算机视觉芯片制造商Movidius和辅助驾驶系统供应商Mobileye。今年3月,英特尔推出了一组人工智能产品,进一步加快了人工智能的产品研发。

4

不但一些研究机构和科技公司在大力发展人工智能机器学习技术,如同石油勘探与生产这样的传统的劳动密集型的行业,也开始转化为现代的、技术为导向的智慧油气田。

机器学习系统可以应用在石油勘探与生产的生命周期,包括地震、地质、油藏、钻井、测井及生产的各个阶段,将数据转化为有价值的知识。深度学习算法可应用于油藏描述、建模和油气田监测。这里举几个在石油工业中深度学习应用的例子。

深度学习算法可以用于输油管道的风险检测。无人机越来越多地被用于管道检查。这些无人机飞越管道时,记录了大量的视频片段。靠人眼很难从这些视频中发现管道泄漏和裂缝等风险。应用深度学习算法自动检测,可以避免人错过的裂缝和泄漏,从而减少基础设施的风险

深度学习算法检测油气田生产异常。石油和天然气公司能够收集大量来自油气田的如同压裂泵和抽油泵传感器的实时数据。在高速时序参数中寻找异常,犹如大海捞针。深度学习算法可以“看到”传统的基于规则的电子状态监测系统难以发现的异常,并能提醒操作中心和指挥中心。

钻井是一项高成本、高风险的投资。在作业计划和执行阶段应用人工智能可以大大提高钻井各个阶段的成功率,包括:井计划、实时钻井优化、实时钻井风险识别。在为钻机提供远程诊断服务时,可以利用深度学习的自然语言处理算法,现场技术人员可以通过语音交互与资产诊断应用程序交互,就像机器人帮助客户服务一样。

值得一提的是,科罗拉多矿业学院的波动现象的中心(CWP,从事石油地震勘探建模、成像和反演方法研究)在今年的517日,也举行了机器学习专题讨论会,报告涉及:“机器学习概念”、“利用高空间数据机器学习”、“多属性解释”、“机器学习预测断层”、“应用机器学习的方法统计识别断层”等。

不但石油工业,在许多传统的商铺和工厂里,也正在通过人工智能机器学习,有效的吸收大量数据,并从中获得有价值预测,如:了解客户购买意向,让业务运营更高效等。

5

人工智能机器学习是当前社会关注的话题。在每天的新闻和媒体中,都在讨论人工智能和机器学习。

MIT技术评论》2017612日的一篇文章称,“法院、银行和其他机构使用自动数据分析系统来决定你的生活。”这并非好消息。标题为《机器偏见》的预告片宣称:“全国有用于预测未来罪犯的软件。而且它对黑人有偏见。”

Stanford NEWS201776日报道称,斯坦福大学的计算机科学家们开发了一种用于诊断心律失常的算法——这种新的深度学习算法可以诊断14种心脏节律缺陷(称为心律失常),比心脏病专家做得更好。这可以加快诊断和改善农村地区的人们的治疗。

机器学习是未来每个领域的人都需要了解的东西。正如前面提到的多明戈斯的新书《终极算法》描述的,“你也许不知道,但机器学习就在你身边,它还存在于你每天的生活中,从你醒来到入睡,每时每刻无时不在。”

看来,机器学习的确正在重塑我们的世界和影响我们的生活。


附注:本文在编写时参考了网上资料,特别是引用了MIT技术评论》有关2017年最聪明的50家公司的资料。这50家公司多集中在:美国西海岸(加利福尼亚州,华盛顿州,亚利桑那州)21家,美国东海岸(马萨诸塞州,纽约,新泽西州,宾夕法尼亚州)10家,中国大陆7家,欧洲(英国,德国,丹麦)6家。MIT技术评论》的网址是:

https://www.technologyreview.com/






http://blog.sciencenet.cn/blog-3005681-1066880.html

上一篇:首个亚太地区大学排行榜百强地域分布
下一篇:展望物联网的未来
收藏 分享 举报

16 罗汉江 朱朝东 沈律 张学文 黄永义 陈南晖 姚宏伟 白桦 杨波 吴施楷 韦玉程 李剑超 强涛 yunmu xlsd leeyuz

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2017-11-20 21:44

Powered by ScienceNet.cn

Copyright © 2007-2017 中国科学报社

返回顶部