Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

商汤50篇论文入选ICCV国际计算机视觉大会,重投入构筑创新护城河

计算机视觉方向顶级学术盛会 ICCV 2021(国际计算机视觉大会)于美国东部时间 10 月 11 日 - 17 日正式召开。商汤科技及联合实验室共计 50 篇论文入选 ICCV 2021,同时在 MFR、LPCV 等多项重要竞赛中夺冠,中国原创技术在国际级学术舞台上再度大放异彩。

ICCV 与 CVPR(计算机视觉模式识别会议)和 ECCV(欧洲计算机视觉会议)并称计算机视觉方向的三大顶级会议。虽然受疫情影响,今年的 ICCV 完全在线上举办,但本届的热度依然不减。作为中国 AI 技术领域的执牛耳者,一直以来商汤科技都致力于坚持原创,此次再次斩获累累硕果,并以学术成果直击产业应用痛点,是对商汤长期在前沿科技领域重投入,并以强大研发团队、领先人工智能基础设置 SenseCore 商汤 AI 大装置构筑稳固创新护城河战略的再度验证与回馈。

50 篇论文入选,多项竞赛问鼎冠军

今年商汤入选的 50 篇论文,涵盖模型量化、三维建模、自动驾驶、机器学习系统决策等多个领域,不仅包括各领域前沿基础研究突破,还直击行业应用痛点。

比如,在《Semantically Coherent Out-of-Distribution Detection》这一论文中,对于开放世界识别问题,商汤团队重新设计了基准测试。所谓开放世界识别,是指让计算机在面对未知世界时,能够识别出未知的物体,而不是认为所有物体都属于已知类别。

测试基准示意图

商汤团队提出的新基准旨在发展该领域,即在要求开放世界模型不仅能够识别出未知类别的同时,还希望它对已知类别的不同形态进行泛化和准确分类。这篇论文同时也提出了有效的解决方案,可以帮助支撑计算机视觉模型的可靠性。

随着 3D 扫描等技术的日益成熟,点云数据的应用场景变得更加的普遍,然而如何从点云中抽取参数化的结构信息以便下游识别、理解、编辑任务依然是一个难题。现有方法要么假设物体只由若干个简单的基本图元 (Primitive) 的并集组成,要么使用复杂的网络去估计一颗动态的 CSG 树。商汤论文《CSG-Stump: A Learning Friendly CSG-Like Representation for Interpretable Shape Parsing》提出了构造几何实体(CSG)的全新表现形式(CSG-Stump),不同于传统的 CSG 树, CSG-Stump 可以将任意深度的 CSG 树压缩成三层并用三个二值化矩阵来表示。在此基础上,商汤提出了一个端到端无监督的构造几何实体预测网络,这样生成的构造几何实体不仅重建效果好,同时具有高可解释,高可编辑性的特点。

CSG-Stump、CSG-Stump 网络、效果展示

除论文外,ICCV 2021 期间的各项挑战赛同样备受关注。其中,LPCV 挑战赛是致力于将计算机视觉技术应用于极致低功耗场景的顶级竞赛,由普渡大学、Facebook、Xilinx 等顶级学术机构和软硬件公司联合举办。商汤模型工具链团队依托工业化的基模型生产体系,通过大规模预训练、检测模型调优、压缩技术和部署能力的软件 - 硬件 - 算法全方位协同,一骑绝尘大比分领先,夺得 FPGA 赛道冠军。

商汤团队在LPCV比赛的FPGA赛道排名第一

此外,为更好地促进三维重建社区的发展,新加坡南洋理工大学 S-Lab,商汤科技海外研发中心 IRDC 和上海人工智能实验室,一起构建了一个大规模且丰富的多视角残缺点云(MVP)数据集和评测基准,并在今年的 ICCV 上举办了 MVP challenge,以供研究人员测试和检验更优的点云补全和点云配准方法。比赛吸引了海内外约 100 支研究团队,经过比赛和交流,启发了大家针对更接近现实采集到的残缺点云数据来设计方案,以实现残缺点云的补全和配准。

残缺点云示意图

原创科技的长期主义者 从定义技术到定义行业 

商汤与 ICCV 的缘分由来已久,自 2016 年以来,商汤及联合实验室 ICCV 录用论文有 140 多篇,持续领跑全球。而事实上,自成立以来,商汤就一直以原创技术与丰硕的研究成果闻名业内。目前,商汤已在顶级学术会议和期刊上发表了 600 多篇论文;人工智能专利及专利申请量达 8,000 多项,并实现连续 6 年专利申请量翻倍增长。

「商汤是坚定的长期主义者。作为一家从实验室中走出来的企业,我们的企业文化来自并深深的根植于研究创新之中,面向着科技应用、赋能百业的无限可能蓬勃发展。」商汤科技联合创始人、研究院院长王晓刚表示。「为此,我们不断在研发上长期重投入,用顶尖的研发团队与 AI 基础设施,构筑稳固的创新护城河。」

自 2014 年脱胎于港中文多媒体实验室以来,商汤已累计吸引来自全球顶尖院校、研究机构的 40 名专家教授、3500 多位研究员加入,是亚洲最大、水平最高的研究团队之一;此外,商汤已累计与全球 52 所顶级大学及 15 个联合实验室开展了广泛而密切的研究合作。丰富的人才资源以及全球化的技术交流与合作,为商汤全栈式人工智能创新体系奠定了坚实基础。


此外,商汤打造了行业内前所未有的通用人工智能基础设施 SenseCore 商汤 AI 大装置,实现了多功能超高精度 AI 模型的大规模量产。王晓刚表示:「SenseCore 打通了算力、算法和平台,让我们能够实现高效率、低成本、规模化的 AI 创新和落地。单就耗时这一项来说,相较于行业需耗时数周,商汤研发及工程团队可以将开发时长缩短至数小时。到今年上半年,商汤已开发超过 22,000 个用于不同应用的商用人工智能模型,涉及多个垂直行业。」目前,凭借卓越的技术及模型生产的规模效应,商汤已在智慧商业、智慧城市、智慧生活及智能汽车领域取得市场领先地位。
理论商汤科技ICCV 2021
相关数据
商汤科技机构

商汤科技作为全球领先的人工智能平台公司,商汤科技SenseTime是中国科技部指定的“智能视觉”国家新一代人工智能开放创新平台。同时,商汤科技也是全球总融资额及估值最高的人工智能创新企业。 商汤科技以“坚持原创,让AI引领人类进步”为愿景。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为亚洲最大的AI算法提供商。 商汤科技在多个垂直领域的市场占有率位居首位,业务涵盖智能手机、互联网娱乐、汽车、智慧城市、以及教育、医疗、零售、广告、金融、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的企业和机构建立合作,包括本田、SNOW、阿里巴巴、苏宁、中国移动、OPPO、vivo、小米、微博、万科、融创等。

http://www.sensetime.com
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

二值化技术

二值化是将像素图像转换为二进制图像的过程。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

Xilinx机构

赛灵思作为FPGA、可编程SoC的发明者,一直坐稳全球最大的FPGA芯片供应商头把交椅。赛灵思的产品线覆盖45/28/20/16nm四个系列的FPGA以及Zynq SoC,旗下拥有着超过4400项技术专利、60多项行业第一的技术产品,服务着全球超过60000的客户。赛灵思耗时4年,超过1500名工程师的研发参与,超过10亿美元的研发投资,推出高度集成的多核异构自适应计算加速平台——ACAP!10月赛灵思发布了统一软件平台Vitis,成功“打破软硬件壁垒”。

https://china.xilinx.com/
相关技术
通用人工智能技术

通用人工智能(AGI)是具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。通用人工智能是一些人工智能研究的主要目标,也是科幻小说和未来研究中的共同话题。一些研究人员将通用人工智能称为强AI(strong AI)或者完全AI(full AI),或称机器具有执行通用智能行为(general intelligent action)的能力。与弱AI(weak AI)相比,强AI可以尝试执行全方位的人类认知能力。

三维重建技术

三维重建是指利用二维投影或影像恢复物体三维信息(形状等)的数学过程和计算机技术。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~