2024年度图灵揭晓又是两位AI！-廊坊卓讯科技有限公司

　　·巴托（Andrew Barto）和理查德·萨顿（Richard Sutton）荣获2024年ACM AM 图灵，以表扬他们正在强化进修范畴奠基的概念取算法根本。自20世纪80年代起，巴托和萨顿通过一系列论文，提出了强化进修的焦点思惟，建立了其数学框架，并开辟了环节算法。强化进修做为建立智能系统的主要方式之一，现在已成为人工智能范畴的基石。人工智能（AI）的焦点正在于建立可以或许并步履的智能体（agent）。智能体的好坏取决于其选择步履方案的能力，而励机制则是评估步履质量的环节。帮帮智能体进修若何更无效境界履。强化进修的能够逃溯到数千年前的动物锻炼方式。1950年，艾伦·图灵正在其论文《计较机械取智能》中提出了“机械可否思虑”的问题，并通过励取赏罚来实现机械进修。虽然图灵和亚瑟·塞缪尔（Arthur Samuel）正在20世纪50年代末开辟了通过棋战进修的跳棋法式，但强化进修正在随后的几十年中进展迟缓。曲到20世纪80年代初，巴托和他的博士生萨顿遭到心理学研究的，将强化进修建立为一个通用问题框架。他们自创了马尔可夫决策过程（MDP）的数学根本，提出了一种正在未知中通过励信号最大化持久累积收益的进修方式。这一框架使得强化进修算法可以或许普遍使用于各类复杂问题。巴托和萨顿还开辟了强化进修的核默算法，包罗时间差分进修、策略梯度方式以及操纵神经收集做为函数暗示的东西。他们的工做不只鞭策了算法的成长，还提出了将进修取规划相连系的智能体设想，为后续研究奠基了根本。虽然巴托和萨顿的算法降生于几十年前，但强化进修的现实使用冲破次要发生正在过去十五年。通过取深度进修相连系（由2018年图灵得从Bengio、Hinton和LeCun鞭策），深度强化进修手艺应运而生。强化进修的标记性包罗AlphaGo正在2016年和2017年打败世界围棋选手，以及近期ChatGPT的开辟。ChatGPT做为一种大型言语模子，以更好地捕获人类期望。此外，强化进修还正在机械人操控、收集堵塞节制、芯片设想、互联网告白优化、全球供应链办理等范畴取得了显著。以至正在计较机科学中最陈旧的矩阵乘法算法优化中，强化进修也阐扬了主要感化。值得一提的是，强化进修的研究还反哺了神经科学。巴托等人的研究表白，某些强化进修算法为人类大脑多巴胺系统的功能供给了最佳注释。安德鲁·巴托（Andrew Barto）是大学阿默斯特分校消息取计较机科学系荣退传授。学生时代，他以优异成就获得密歇根大学数学学士学位，之后于1977年正在该校起头职业生活生计，历任博士后研究员、副传授、传授及系从任。曾获麻省大学神经科学终身成绩、IJCAI研究精采等荣誉，是IEEE和美国科学推进会（AAAS）的会士。现任阿尔伯塔大学计较机科学传授、Keen Technologies研究科学家，以及阿尔伯塔机械智能研究所（Amii）首席科学参谋。他曾正在2017年至2023年担任DeepMind的精采研究科学家。萨顿取巴托的合做始于1978年，其时巴托是他的博士导师。萨顿正在斯坦福大学获得心理学学士学位，并正在大学阿默斯特分校取得计较机取消息科学硕士和博士学位。他曾获IJCAI研究精采、人工智能协会终身成绩等荣誉，是伦敦皇家学会、人工智能推进协会和皇家学会的会士。ACM A。M 。图灵凡是被称为“计较范畴的诺贝尔”，金为100万美元，由谷歌公司供给资金支撑。该以阐明计较数学根本的英国数学家艾伦·m·图灵的名字定名。

2024年度图灵揭晓又是两位AI！

原创卓讯德清民政 2025-04-25 00:37 发表于浙江

关于我们

联系我们

微信公众号

2024年度图灵揭晓又是两位AI！

原创 卓讯 德清民政 2025-04-25 00:37 发表于浙江

关于我们

联系我们

微信公众号

原创卓讯德清民政 2025-04-25 00:37 发表于浙江