Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AI国际顶会ICLR 2024结果揭晓,蚂蚁集团11篇论文入选

近日,人工智能顶会之一ICLR 2024录用结果揭晓,蚂蚁集团有11篇论文被收录,其中1篇为Oral,3篇为Spotlight,7篇为Poster,蚂蚁集团在AI学术领域的进展受到关注。

(图:蚂蚁集团的《长视频中的多粒度噪声关联学习》被收录为Oral论文)

ICLR组委会今年共收到了7262篇论文投稿,录用率约为31%。其中,1.2%被录用为Oral论文,作者获得10分钟的口头演讲,5%被录用为Spotlight论文,获得4分钟的聚光灯展示;Poster论文则以海报形式展示。论文的重要性按此三类递减。

每年,ICLR Oral论文中一大半的论文会成为“ICLR Best Paper”,同时也代表了新一年的研究方向,今年ICLR评出的Oral论文共85篇,其中包括蚂蚁集团的《Multi-granularity Correspondence Learning from Noisy Instructional Videos》(长视频中的多粒度噪声关联学习)。

短视频已成为大众日常生活的主要娱乐方式,多模态技术也是当前AI的热门领域,由于过高的计算资源开销,现有的视频工作主要集中于片段的理解,而忽视了长视频中的时序依赖。该论文将长视频学习转化为短视频片段间的关联对齐,针对视频与文本间显著存在的噪声关联问题,提出了统一的最优传输对齐方案,显著提升了长视频理解能力并节省了时间开销。

这个方案还具有通用性,提出的噪声关联处理方法可应用于其他模态需要进行内容对齐的模型预训练学习中。

收录为Spotlight的3篇论文分别是《iTransformer: Inverted Transformers Are Effective for Time Series Forecasting》(iTransformer:倒置Transformer对时序预测更加有效),讲述一种新的时间序列预测工作,打破常规模型结构,在复杂时序预测任务中取得了全面领先;《Enhanced Face Recognition using Intra-class Incoherence Constraint》(利用类内不一致性约束增强的人脸识别技术),引入一个新的方法,进一步提高人脸识别的精确度。《Finite-State Autoregressive Entropy Coding for Efficient Learned Lossless Compression》(基于查找表实现的可学习自回归模型用于高效无损压缩算法),提出了一种新的算法,实现了高压缩率、高吞吐率的无损压缩。

自2017年以来,ICLR每年收到的论文数量以30%的速度增长,其它两个人工智能顶会NeurIPS、ICML也是高增长。在上个月举行的NeurlPS上,蚂蚁集团共有20篇论文被收录,覆盖计算机视觉自然语言处理图神经网络图像处理等多个人工智能机器学习领域的前沿主题。

图:ICLR自2013年成立以来,每年的论文数量情况。2017年开始,论文数量攀升。

ICLR近年受到业内好评,主要原因是其推行的Open Review评审制度,所有提交的论文都会接受所有同行的评价及提问,任何学者都可匿名或实名地评价论文。而在公开评审结束后,论文作者也能够对论文进行调整和修改。

据了解,过去五年,蚂蚁集团在国际顶级学术期刊和学术会议上发表论文近500篇,其中AI领域的论文300余篇。蚂蚁集团人工智能领域持续进行技术投入,基于大规模业务场景的需求,布局了包括大模型、知识图谱运筹优化、图学习、可信AI等在内的技术领域。


入门噪声关联多模态技术关联学习ICLR
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

运筹优化技术

最优化问题(英语:Optimization problem)在数学与计算机科学领域中,是从所有可行解中寻找最优良的解的问题。根据变数是连续的或离散的,最佳化问题可分为两类:连续最佳化问题与组合优化。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

自回归模型技术

自回归模型,是统计上一种处理时间序列的方法,自回归模型被广泛运用在经济学、资讯学、自然现象的预测上。

时间序列预测技术

时间序列预测法其实是一种回归预测方法,属于定量预测,其基本原理是;一方面承认事物发展的延续性,运用过去时间序列的数据进行统计分析,推测出事物的发展趋势;另一方面充分考虑到偶然因素影响而产生的随机性,为了消除随机波动的影响,利用历史数据进行统计分析,并对数据进行适当处理,进行趋势预测。

蚂蚁集团机构

蚂蚁集团是移动支付平台支付宝的母公司,也是全球领先的金融科技开放平台,致力于以科技和创新推动包括金融服务业在内的全球现代服务业的数字化升级,携手合作伙伴为消费者和小微企业提供普惠、绿色、可持续的服务,为世界带来微小而美好的改变。

http://www.antgroup.com
时序预测技术

时序预测(时间序列预测)是预测时间序列未来值(以及不确定性的边界)的任务。

推荐文章
暂无评论
暂无评论~