机器之心编辑部报道

虽迟但到!IJCAI 2020大会线上举行,全部论文奖项公布

IJCAI 2020 全部论文奖项公布

北京时间 1 月 7 日,IJCAI 2020 在线上开幕。目前,大会已经公布了包括 IJCAI-JAIR 最佳论文、AIJ 奖、杰出论文奖等多个奖项。

IJCAI 2020 原定于 2020 年 7 月在日本横滨举行,受到疫情影响,延期至 2021 年 1 月线上召开。

从整体数据上看,IJCAI 2020 是史上接收率最低的一届,4717 份有效投稿仅有 592 篇被接收,接收率为 12.6%。
图片来源:https://github.com/lixin4ever/Conference-Acceptance-Rate

与往年大会相比,今年最大的变化就是线下大会专为虚拟会议,而会议界面的清新风格,也是让参会者耳目一新,一度以为自己进入了某游戏界面。

杰出论文奖

本次共有两篇论文获得 IJCAI 2020 杰出论文奖。
  • 《Synthesizing Aspect-Driven Recommendation Explanations from Reviews》

论文地址:https://www.ijcai.org/Proceedings/2020/0336.pdf

论文摘要:解释有助于理解建议并增加采纳的可能性,然而有些解释性建议方法依赖于严格、标准化的模板。为了获取更加灵活、通俗、多样化的解释,覆盖 interest 各个方面,来自新加坡管理大学的研究者从评论中选择片段来进行综合解释,同时优化了其代表性和连贯性。为了适应目标用户的偏好,研究者基于一个兼容的可解释推荐模型,将观点与上下文相衔接。几个产品类别数据集上的实验表明,在模板、评论摘要、选择和文本生成这些方面,本文方法具备更高的效率。

本文提出框架 SEER 的架构。
  • 《A Multi-Objective Approach to Mitigate Negative Side Effects》

论文地址:https://www.ijcai.org/Proceedings/2020/0050.pdf

论文摘要:非结构化环境内运行的智能体通常会产生设计时不容易识别的负面作用 (NSE) 。来自 UMass Amherst 和微软研究院的研究者分析了在系统部署过程中,如何利用各种形式的人类反馈或自主探索,来学习与 NSE 相关的惩罚函数。他们将降低 NSE 影响的问题描述为一个具备字典式奖励偏好与松弛多目标马尔科夫决策过程。松弛指的是相对于智能体的主要目标允许的最优策略的最大偏差,以减少次要目标 NSE。

多项实验评估表明,本文所提出的框架能够成功减少 NSE 的影响,不同的反馈机制会带来不同的偏差,从而影响 NSE 的识别。

论文提出的消除 NSE 的框架

IJCAI-JAIR 最佳论文奖

IJCAI-JAIR 最佳论文这一奖项颁发给过去五年里发表在《人工智能研究杂志(JAIR)》上的优秀论文。

2020 IJCAI-JAIR 最佳论文

论文地址:https://www.jair.org/index.php/jair/article/view/11175

论文摘要:该研究的主题是在高维连续环境中构造抽象表征以进行规划。研究者假设一个具有高级操作集合的智能体,并构造可证明的表征以评估由操作序列组成的规划

研究者首先考虑确定性规划的情况,并表明相关计算涉及对状态集执行的集合操作。该研究定义了对于规划来说必需和足够的特定集合,并利用它们构建可证明适用于确定性规划的基础(grounded)抽象符号表征。结果表征可用 PPDL 表示。该研究为 Playroom 域构建了一个表征,并使用现成的规划程序以毫秒为单位对其进行求解。

然后,该研究扩展至概率规划,其中需要将状态集泛化至状态分布。该研究确定了规划所需的特定分布,并使用它们构建一种基础的抽象符号表征,以正确地预估任何规划的预估回报和成功概率。此外,该研究表明学习相关概率分布和概率密度估计与概率分类的特定实例相对应。该研究构建了一个能够自主学习计算机游戏域的正确抽象表征并迅速解决它的智能体。

最后,研究者利用这些技术创建了一个物理机器人系统,该系统可以直接从感觉运动数据(包括点云、位置映射和关节角度等)自主学习其移动操作任务符号表征,然后使用该表征进行规划,这些结果共同建立了高层行为与抽象表征、构建可证明的抽象表征的具体理论基础以及自主学习抽象高层表征的实际机制之间的原理性联系。

最佳论文荣誉提名

IJCAI 2020 最佳论文荣誉提名奖由 2015 年发表在 JAIR 上的论文《Coactive Learning》摘得,两位作者分别来自领英和康奈尔大学。

论文链接:https://jair.org/index.php/jair/article/view/10939/26066

论文摘要:在本文中,两位研究者提出将强制学习(Coactive Learning)作为学习系统与人类用户之间交互的模型,这两者具有向用户提供最大效用结果的共同目标。强制学习模型中的交互采取以下形式:在每一步骤中,系统(如搜索引擎)接收文本(如查询)并预测对象(如排名);如有必要,用户做出响应纠正系统,以反馈稍有改善(并不一定是最优)的对象。

他们认为,与专家模型中需要的最优反馈或者强盗学习(bandit learning)中需要的基数评估不同,这种偏好反馈可以通过可观察的用户行为(如网页搜索中的点击)来实现大量地推理。尽管对反馈的要求比较宽松,该研究表明现有很多在线学习算法都有可能适应这种强制学习框架。特别地,研究者提供的算法在基数效用方面实现了 O(1/ √ T) 的平均后悔,尽管学习算法从未直接观察基数效用值。此外还提供了一种λ- 强凸损失函数情况下平均后悔为 O(log(T)/T) 的算法。大量的实证研究验证了该研究中模型和算法在电影推荐任务和网页搜索排名中的适用性。

该研究强制学习算法的通用模板。

AIJ 奖  Artificial Intelligence Journal Awards 

AIJ 突出论文奖(AIJ Prominent Paper Award)表彰不早于 7 年内发表在 AI 期刊上,并且具有很高的重要性以及影响力的论文研究。

2020 AIJ 突出论文奖
  • 《Conflict-Based Search for Optimal Multi-Agent Pathfinding》

论文地址:https://www.sciencedirect.com/science/article/pii/S0004370214001386

论文摘要:在多智能体路径规划(MAPF)中,给定一组智能体,每个智能体都有各自的起始位置和目标位置。该任务要为所有的智能体找到路径,同时避免冲突。在之前的研究中,研究人员为此问题而进行的大多数工作都以最佳方式将多个单独的智能体视为单联合智能体,然后使用 A *算法的单智能体搜索变体。

本文提出了基于冲突的搜索(CBS),一种新的最优多智能体路径规划算法。CBS 是一种两级(two-level)算法,该算法不会将问题转换为单个联合智能体模型。该方法在高层级上对冲突树(CT)进行搜索,冲突树是基于单独的智能体之间的冲突建立的。CT 中的每个节点代表了一组对智能体动作的约束。在低层级上,执行快速单智能体搜索以满足高层级 CT 节点施加的约束。在很多情况下,这种两层级形式使得 CBS 需要检查的状态少于 A * 算法,但结果仍然保持最佳。该研究对 CBS 进行了分析,并描述了其优点和缺点。

此外,该研究还提出了元智能体 CBS(Meta-Agent CBS,MA-CBS)算法。MA-CBS 是 CBS 的一种泛化形式。不同于基础 CBS,MA-CBS 不受限于低级别的单智能体搜索。相反,MA-CBS 允许将智能体合并为联合智能体的小组。这缓解了基础 CBS 一些缺点,并进一步提高了性能。

MA-CBS 是一个可以建立在任何最佳和完整的 MAPF 解算器之上的框架,并且可以提升其性能。在多种问题上的实验结果表明,与以前的方法相比,该方法的速度提高了一个数量级。

AIJ 经典论文奖(AIJ Classic Paper Award)会颁发至少 15 年前在 AI 期刊上发表的优秀论文,其影响力要显著且卓越。

2020 AIJ 经典论文奖
  • Temporal Constraint Networks

论文地址:https://www.sciencedirect.com/science/article/abs/pii/0004370291900066

论文摘要:该论文将基于网络的约束满足方法扩展为包含连续变量,从而提供了一个处理时间约束的框架。在这个被称为时间约束满足问题(TCSP)的框架中,变量代表时间点,时间信息由一组一元和二元约束表示,每个约束都指定了一组允许的间隔。

该框架的独特之处在于允许处理度量标准信息,即评估事件之间的时间差。该研究提出了用于执行以下推理任务的算法:找到给定事件可能发生的所有可行时间,找到两个给定事件之间的所有可能关系,并生成一个或多个与所提供信息一致的场景。

该研究还区分了简单时间问题(STPs)和一般时间问题,前者对任何一对时间点最多允许一个间隔约束。研究证明,包含 Vilain 和 Kautz 点代数的主要部分的 STP 可以在多项式时间内求解。

对于一般的 TCSPs,论文提出了一种分解方案,该方案执行所考虑的三个推理任务,并引入各种技术来提高其效率。此外,论文还研究了路径一致性算法作为时间问题预处理的适用性,证明了它们的可终止性(termination )和并限制了它们的复杂性。

目前,IJCAI 2020 的其他奖项也已全部公布,包括卓越研究奖(Research Excellence Award)、计算机与思想奖(Computer and Thought Award)、约翰麦卡锡奖(John McCarthy Award)以及杰出服务奖(Donald E. Walker Distinguished Service Award)。香港科技大学的杨强教授是本次 IJCAI 奖项评选委员会的成员之一。

卓越研究奖

卓越研究奖旨在表彰在整个职业生涯中一直进行高质量研究并取得若干重大成果的科学家,往届获奖者包括 Marvin Minsky (1991)、Judea Pearl (1999)、 Geoffrey E. Hinton (2005)、 Michael I. Jordan (2016), 和 Jitendra Malik (2018) 等人工智能领域最杰出的科学家。

2020 年的卓越研究奖得主为 Eugene Freuder,他是爱尔兰科克大学的计算机科学和信息技术名誉教授,因其在基于约束的推理和问题解决方面的开创性研究而被公认。

计算机与思想奖

IJCAI 计算机与思想奖主要颁发给人工智能领域的杰出青年科学家。这一奖项是根据《计算机和思想》这本书(编辑为 Edward Feigenbaum 和 Julian Feldman)的版税设立的,目前由 IJCAI 基金资助。

2020 IJCAI 计算机与思想奖的获得者是 Piotr Skowron,他是华沙大学数学、信息学、机械学院助理教授,因其计算社会选择和委员会选举理论方面的贡献而被公认。

约翰麦卡锡奖

约翰麦卡锡奖旨在表彰那些拿到博士学位 15-25 年之间、在人工智能领域做出卓越贡献的职业生涯中期研究人员。该奖项以人工智能先驱 John McCarthy 的名字命名。该奖项的设立受到了麦卡锡家族的支持,往年的获得者有 Bart Selman (2015)、

2020 年约翰麦卡锡奖的获得者是 Daniela Rus,她是麻省理工学院电子工程和计算机科学 Andrew and Erna Viterbi 教授和 CSAIL 实验室主任。Rus 教授因在自动化科学与工程方面的贡献及多智能体算法的研究而得到公认。

杰出服务奖

IJCAI 杰出服务奖设立于 1979 年,旨在表彰为 AI 领域做出贡献并提供服务的资深科学家。IJCAI-2020 杰出服务奖的获得者是 Toby Walsh,新南威尔士大学人工智能科学教授,他是澳大利亚联邦科学与工业研究组织 (CSIRO)Data61 算法决策理论组的领导者,因其在人工智能领域广泛的贡献和服务而获得认可。

上周开始的 IJCAI 2020 大会,是在为去年疫情延期的活动「补交作业」,今年还有一场 IJCAI——根据计划,IJCAI 2021 会在今年的 8 月在加拿大蒙特利尔举行。

此前大会官方正式宣布南京大学的周志华教授为 IJCAI 2021 程序主席,这也是 IJCAI 历史上首次由华人担任程序主席一职。此外,程序委员会成员还包括多位华人学者:
  • 字节跳动 AI Lab 负责人李航

  • 东南大学计算机科学与工程学院教授、博士生导师张敏灵

  • 南京大学人工智能学院教授俞扬

  • 北京大学智能科学系教授林宙辰

  • 斯坦福大学计算机科学系助理教授吴佳俊

  • 卡内基梅隆大学计算机科学系助理教授方飞

  • 清华大学计算机科学与技术系助理研究员刘知远

  • 南京大学计算机系博士生谭志豪

此前,IJCAI 2021 的论文投稿日程已经公布,这个月正好也是投稿 deadline,今年的大会,你投稿了吗?

理论IJCAI 2020论文奖项
相关数据
网页搜索技术

Web搜索引擎是一种软件系统,旨在搜索万维网上的信息。 搜索结果通常以一系列结果呈现,通常称为搜索引擎结果页面(SERP)。 该信息可以是网页、图像和其他类型的文件的混合。一些搜索引擎还挖掘数据库或打开目录中可用的数据。 与仅由人工编辑器维护的网络目录不同,搜索引擎还通过在网络爬虫上运行算法来维护实时信息。 不能被网络搜索引擎搜索的因特网内容通常被描述为深度网络(deep web)。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

损失函数技术

在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

路径规划技术

路径规划是运动规划的主要研究内容之一。运动规划由路径规划和轨迹规划组成,连接起点位置和终点位置的序列点或曲线被称为路径,构成路径的策略则被称为路径规划。路径规划在很多领域都具有广泛的应用,如机器人的自主无碰行动;无人机的避障突防飞行等。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

约束满足问题技术

约束补偿问题(CSPs)是种数学的问题,其定义为一组物件(object),而这些物件需要满足一些限制或条件。 CSPs将其问题中的单元(entities)表示成在变数上有限条件的一组同质(homogeneous)的集合, 这类问题透过"约束补偿方法"来解决。CSPs是人工智能和运筹学 的热门主题,因为它们公式中的规律,提供了共同基础来分析、解决很多看似不相关的问题。 CSPs通常呈现高复杂性, 需要同时透过启发式搜索 和 联合搜索 的方法,来在合理的时间内解决问题。 布林可满足性问题 (SAT), 可满足性的理论 (SMT)和回答集程式设计 (ASP) 可以算是某种程度上的约束补偿问题。

在线学习技术

在计算机科学中,在线学习是一种机器学习方法。和立即对整个训练数据集进行学习的批处理学习技术相反,在线学习的数据按顺序可用,并在每个步骤使用未来数据更新最佳预测器。

推荐文章
暂无评论
暂无评论~