商汤科技62篇论文入选CVPR 2020,摘NIST FRVT五项第一

(2020年5月12日,北京)全球领先的人工智能平台公司商汤科技SenseTime 及其联合实验室共有62篇论文入选计算机视觉国际顶会CVPR 2020(Computer Vision and Pattern Recognition,国际计算机视觉模式识别)。在该会议论文录取难度逐年加大的情况下,商汤在论文录用数量方面持续领跑行业,再次让世界看见中国原创技术的硬核实力。

CVPR与ICCV、ECCV并称为计算机视觉领域三大国际会议之一。根据官方数据,本届CVPR大会共收到6656篇投稿,接收论文1470篇,录用率约22%,低于ICCV 2019论文录用率(25%),为十年以来CVPR论文录用率最低。

建筑与房屋的城市空拍图与配字

描述已自动生成

深耕科研,实现多个领域技术突破 

商汤科技CVPR 2020录用论文在多个领域实现突破,包括:对抗式生成模型、三维点云理解与分析、训练加速与模型量化、视频理解与分析、网络结构搜索等。这些突破性的计算机视觉研究也有丰富的应用场景,将为推动AI行业发展作出贡献。

例如,入选CVPR 2020论文《对人脸生成模型的隐空间可解释性分析》提出了一种简单而通用的技术InterFaceGAN,用于在潜在空间中进行语义人脸编辑,可控制姿势以及其他面部属性,例如性别、年龄、眼镜等,还能够纠正GAN造成的伪影。

WechatIMG385这种方法对GAN的隐空间进行了深入分析,能更好理解GAN是如何将一个随机噪声转化为一张高质量图片的。

如何提升深度学习的训练速度,一直是人工智能领域研究的难点。商汤入选CVPR 2020的论文《用于加速卷积神经网络训练过程INT8训练技术》,提出了用于加速卷积神经网络训练过程的INT8训练技术,采用8比特数值训练模型,可以极大地提升训练速度,减少计算损耗,而且训练精度几乎无损。

获得NIST FRVT 2020五项第一

商汤不仅在CVPR会议上发表了众多创新算法,还在各类国际大赛/基准上屡获佳绩。

今年3月,全球权威人脸识别算法测试NIST FRVT 1:N 2020公布了结果,商汤科技一举拿下了五项第一。FRVT(Face Recognition Vendor Test)由美国国家标准与技术研究院(National Institute of Standards and Technology,NIST)主办,是当今全球规模最大、标准最严、竞争最激烈、最权威的人脸识别算法测试,素有工业界黄金标准之称。

在1200万底库,单图片注册下高阈值动态测试识别率商汤算法获得全线第一;测试全集1200万底库,单图片注册下rankbased top-1识别率商汤算法全线第一;mugshots/webcam主要场景下漏检率商汤算法名列第一;160万底库,两大主要场景任意阈值动态测试下识别率商汤算法全线第一;0-18年龄差距、rankbased top-1测试识别率商汤算法全线第一。

商汤一方面不断追求算法创新,积极在知名会议与期刊发表论文,开源相关模型与代码,持续为学界研究的持续发展做出贡献。另一方面,商汤更加重视研究算法在实际应用中的落地,不断推进算法在不同行业实际生产环境中的应用产生价值,让AI更好更多更快的服务于社会生产的方方面面。

产业CVPR 2020商汤科技
相关数据
商汤科技机构

作为全球领先的人工智能平台公司,商汤科技SenseTime是中国科技部指定的“智能视觉”国家新一代人工智能开放创新平台。同时,商汤科技也是全球总融资额及估值最高的人工智能创新企业。 商汤科技以“坚持原创,让AI引领人类进步”为愿景。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为亚洲最大的AI算法提供商。 商汤科技在多个垂直领域的市场占有率位居首位,业务涵盖智能手机、互联网娱乐、汽车、智慧城市、以及教育、医疗、零售、广告、金融、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的企业和机构建立合作,包括本田、SNOW、阿里巴巴、苏宁、中国移动、OPPO、vivo、小米、微博、万科、融创等。

http://www.sensetime.com
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

人脸生成技术

人脸生成是从现有数据集生成(或插值)新面孔的任务。

结构搜索技术

深度学习提供了这样一种承诺:它可以绕过手动特征工程的流程,通过端对端的方式联合学习中间表征与统计模型。 然而,神经网络架构本身通常由专家以艰苦的、一事一议的方式临时设计出来。 神经网络架构搜索(NAS)被誉为一条减轻痛苦之路,它可以自动识别哪些网络优于手工设计的网络。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~