||
3月5日,美国计算机学会(ACM,Association for Computing Machinery)宣布Andrew Barto 和 Richard Sutton 获得2024年图灵奖(A.M. Turing Award),以表彰他们为强化学习(Reinforcement Learning)奠定了概念和算法基础,详见官网消息:https://awards.acm.org/about/2024-turing。强化学习是创建智能系统的最重要方法之一,目前火热的人工智能均用到了强化学习方法。图灵奖通常被称为“计算机界的诺贝尔奖”,目前奖金为 100 万美元、由谷歌公司提供资金支持。该奖项以阐述计算数学基础的英国数学家艾伦·图灵(Alan Mathison Turing)的名字命名。图灵奖年度评选,一般是1人,少数年份2人。
图1:图灵奖
Andrew Barto是马萨诸塞大学阿默斯特分校信息与计算机科学名誉教授。1975年,Barto获密歇根大学博士学位,博士论文题为:CELLULAR AUTOMATA AS MODELS OF NATURAL SYSTEMS(作为自然系统模型的细胞自动机),论文全文:Andrew Barto博士论文.pdf。此文收录在科睿唯安的ProQuest Dissertations & Theses Global (ProQuest全球博硕论文数据库)中,数据库中此文链接为:https://www.proquest.com/docview/302780043。
图2:Andrew Barto
Richard Sutton是阿尔伯塔大学计算机科学教授。1984年,Sutton获马萨诸塞大学阿默斯特分校博士学位,Andrew Barto是其博士导师,博士论文题为:TEMPORAL CREDIT ASSIGNMENT IN REINFORCEMENT LEARNING(强化学习中的时间信用分配),论文全文:Richard Sutton博士论文.pdf。此文收录在科睿唯安的ProQuest Dissertations & Theses Global (ProQuest全球博硕论文数据库)中,数据库中此文链接为:https://www.proquest.com/docview/303321395。
图3:Richard Sutton
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-4-25 07:28
Powered by ScienceNet.cn
Copyright © 2007-2025 中国科学报社