Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AAAI 2024杰出论文奖出炉:西安电子科技大学获奖

让我们恭喜获奖者!

本周,全球 AI 顶会 AAAI 2024 正式开幕,目前已公布了最佳论文(Outstanding Paper Award)等多个重要奖项。

AAAI 全称为国际先进人工智能协会 (Association for the Advancement of Artificial Intelligence),其每年举办的现场会议是人工智能领域里历史最悠久、涵盖内容最广泛的的国际顶级学术会议之一,今年已是第 38 届。据中国计算机学会推荐国际学术会议和期刊目录,AAAI 为人工智能领域的 A 类会议。

据了解,本届 AAAI 会议共有 10504 篇投稿(主赛道),继续打破历史纪录。经过全面而严格的审查程序,共有 2527 篇论文脱颖而出,录取率为 24.1%,相比此前有所提升。

本次大会于 2 月 20-27 日在加拿大温哥华会议中心举行。

图片

                                                          图片来自 @RealAAAI。

图片

                              图片来自 Yann LeCun。

杰出论文奖(Outstanding Paper Award)

本周四,AAAI 2024 公布了杰出论文奖,共三篇论文入选,作者中有不少华人的身影。

图片

论文1:Reliable Conflictive Multi-view Learning

  • 作者:Cai Xu、Jiajun Si、Ziyu Guan、Wei Zhao、Yue Wu、Xiyue Gao,来自西安电子科技大学。

论文2:GxVAEs: Two Joint VAEs Generate Hit Molecules from Gene Expression Profiles

  • 作者:李晨(Chen Li)、山西芳裕(Yoshihiro Yamanishi),来自名古屋大学。

论文3:Proportional Aggregation of Preferences for Sequential Decision Making

  • 作者:Nikhil Chandak、Shashwat Goel、Dominik Peters,来自海得拉巴国际信息技术学院(IIIT Hyderabad)、巴黎第九大学(Universit´e Paris Dauphine)。

  • 论文链接(预印版):https://arxiv.org/abs/2306.14858

AAAI 2024 经典论文奖

AAAI 大会「经典论文奖」设立于 1999 年,旨在表彰从特定会议年度中选出的最具影响力的论文作者。今年该奖项颁给了第二十三届 AAAI 最具影响力的论文《Maximum Entropy Inverse Reinforcement Learning》,理由是这项研究将熵正则化引入强化学习,从而提高了预测、模仿学习、决策和人类 - AI 对齐的预测准确率

图片

论文地址:https://cdn.aaai.org/AAAI/2008/AAAI08-227.pdf

论文作者:Brian Ziebart, Andrew Maas, Andrew Bagnell, Anind Dey

机构:CMU

论文摘要:有研究表明将模仿学习问题设计为马尔可夫决策问题(Markov Decision Problems)的解决方案,是有益的。这种方法将学习过程简化为恢复一个效用函数的问题。

这项工作开发了一种基于最大熵原理的概率方法,其在决策序列上提供了一个定义良好的全局规范化分布,同时提供了与现有方法相同的性能保证。研究者在对现实世界的导航和驾驶行为进行建模的背景下开发技术,收集的数据本质上是嘈杂且不完美的。本文提出的概率方法可以对路线偏好进行建模,并提供一种基于部分轨迹推断目的地和路线的强大新方法。

AI 人类福祉奖

AAAI 的 AI 人类福祉奖旨在表彰保护、增强和改善人类生活,对人们生活具有长期积极影响的 AI 研究者。

今年的获得这一奖项的是哈佛大学计算机科学教授 Milind Tambe。Milind Tambe 是 AAAI Fellow 、ACM Fellow ,他还是 Google Research「AI for Social Good」计划的负责人。

Robert S. Engelmore 纪念奖

Robert S. Engelmore 纪念奖旨在表彰对自动化规划机器学习机器人技术在现实世界问题中的应用,以及对人工智能社区的广泛服务作出杰出贡献的个人。

今年的奖项颁给了 Raquel Urtasun(来自多伦多大学),以表彰她「对自动驾驶领域的机器学习计算机视觉和创业做出的杰出贡献」。

AAAI/EAAI Patrick Henry Winston 杰出教育家奖

每年一度的 AAAI/EAAI 杰出教育家奖旨在表彰对人工智能教育做出重大贡献、为人工智能社区和整个社会带来持久利益的个人(或群体)。

2024 年获奖者是 Charles Isbell(来自威斯康星大学麦迪逊分校)和 Michael L. Littman(来自布朗大学),大会表彰他们「通过在线课程覆盖成千上万的学生,并通过创造性、娱乐性的方式向公众推广人工智能机器学习的创新教学」 。

AAAI 杰出服务奖

AAAI 杰出服务奖每年表彰一位为人工智能社区提供卓越服务的个人。

今年的获奖者是 Ashok Goel,大会表彰他「通过广泛的领导力,特别是作为《AI Magazine》的主编和《Interactive AI Magazine》的创始编辑,为人工智能领域做出的杰出服务,以及在人工智能教育方面持续的跨学科贡献」。

参考内容:

https://aaai.org/about-aaai/aaai-awards/

https://twitter.com/PJNarayanan/status/1760719589279690837

产业AAAI 2024
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

规范化技术

规范化:将属性数据按比例缩放,使之落入一个小的特定区间,如-1.0 到1.0 或0.0 到1.0。 通过将属性数据按比例缩放,使之落入一个小的特定区间,如0.0到1.0,对属性规范化。对于距离度量分类算法,如涉及神经网络或诸如最临近分类和聚类的分类算法,规范化特别有用。如果使用神经网络后向传播算法进行分类挖掘,对于训练样本属性输入值规范化将有助于加快学习阶段的速度。对于基于距离的方法,规范化可以帮助防止具有较大初始值域的属性与具有较小初始值域的属相相比,权重过大。有许多数据规范化的方法,包括最小-最大规范化、z-score规范化和按小数定标规范化。

正则化技术

当模型的复杂度增大时,训练误差会逐渐减小并趋向于0;而测试误差会先减小,达到最小值后又增大。当选择的模型复杂度过大时,过拟合现象就会发生。这样,在学习时就要防止过拟合。进行最优模型的选择,即选择复杂度适当的模型,以达到使测试误差最小的学习目的。

模仿学习技术

模仿学习(Imitation Learning)背后的原理是是通过隐含地给学习器关于这个世界的先验信息,就能执行、学习人类行为。在模仿学习任务中,智能体(agent)为了学习到策略从而尽可能像人类专家那样执行一种行为,它会寻找一种最佳的方式来使用由该专家示范的训练集(输入-输出对)。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

推荐文章
暂无评论
暂无评论~