Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

1人15篇入选?华人论文知多少?深度分析ICCV2019论文录取背后的那些事儿!

你要问,有什么能把全球人工智能圈子里的科技巨头公司和技术大牛们聚集到一起?

自然是AI顶会啦!

本周日,ICCV2019将在韩国首尔正式拉开帷幕。

据早前公布的投稿数量显示,中国高校和企业在今年的ICCV是大放异彩。因此,今年的大会显得格外令人期待。

据悉,在30年ICCV大会历史上,上一届ICCV堪称火爆出奇的一届,参会人数达到3107名。

而时隔两年后,本届ICCV又会出现怎样的盛况呢? 上届ICCV,何凯明团队包揽2项ICCV 2017最佳论文奖,而今年他们会再创佳绩吗?

我们拭目以待!

详解ICCV2019

按照ICCV官方披露信息,今年共计收到4328篇论文投稿--这一数量是上一届( ICCV 2017) 的两倍。其中总共有1077篇论文入选,接收率为25.02%。  

因投稿人数的激增,可能直接导致了今年的接收率比去年降低了将近4%。

而跟隔壁CVPR相比,两者的录取率虽然看起来差别不大,但是相比CVPR一年一次的频率,ICCV两年才举办一次,通过率其实更低。

下图显示了2011至今以来ICCV接收的论文投稿数和最终录用数对比情况。

整体上看,ICCV的投稿论文数逐年递增趋势非常明显,从2011年至2019年,投稿数翻了3倍,但是接收率近几年却有小幅下滑。

可见随着AI的爆发导致各类研究方向的火热,ICCV的论文接收难度也会有所提高。

我们对论文题目的关键词进行了提取,词云图如下:

ICCV2019的关键词主要集中在行人重识别、目标检测语义分割、图像理解、人体姿态估计生成对抗网络、视频目标检测卷积神经网络小样本学习等领域,以上方向也是近年来计算机视觉研究的热点。

从作者维度分析

从作者维度统计分析,被接收的1077篇论文,总共来自3700位科研人员。

其中有3078位作者1篇入选, 393位作者2篇入选,111位作者3篇入选,51位4篇入选,23位5篇入选,19位6篇入选,11位7篇入选,5位8篇入选。

六篇以上论文入选的学者见下图:

单人9篇以上入选的共有9人。

其中商汤研究院院长、香港中文大学副教授王晓刚,深度学习计算机视觉领域专家、悉尼大学高级讲师欧阳万里,ICCV2017杰出研究者获得者、瑞士苏黎世联邦理工学院(ETH Zurich)计算机视觉教授 Luc van Gool ,CVPR2019大会主席、马里兰大学教授Larry Davis,大连理工大学卢湖川教授,澳大利亚科学院院士、悉尼大学陶大程教授都是九篇入选。

邵岭

入选论文最多的荣誉属于阿联酋国家级“起源人工智能研究院”(IIAI)CEO兼首席科学家邵岭博士,他曾是英国东安格利亚大学计算机学院的教授,英国计算机学会 Fellow、IET Fellow、IEEE 高级会员以及 ACM 终身会员。他署名投稿的论文,共有15篇被接收。而本届ICCV,IIAI成绩斐然,共有28篇论文入选。

入选论文排名第二的有两位大牛,分别都有10篇论文入选;一位是悉尼科技大学教授杨易,去年加入了百度研究院;另一位是IEEE Fellow、华为诺亚方舟实验室计算视觉首席科学家田奇,他曾是美国德克萨斯大学圣安东尼奥分校计算机系教授。

按照论文的作者个数来看,最多署名的是4人,共有272篇;其次是是3人与5人,各有202和222篇。仅有3篇论文拥有唯一作者,还有1篇竟有17人署名,以14人署名的也有1篇。

按照第一作者来看,共有35位研究人员以一作身份发文2篇。

从作者所属机构分析

虽然早在今年3月,ICCV2019就在官方推特公布了23个论文投稿单位,其中来自中国的单位有:中科院、清华大学、华为百度,分别以237、175、91、47篇的投稿数量位列第1、第2、第6和第15位。

此外,微软(103)、谷歌(100)、苏黎世联邦理工学院(99)、Facebook(85)、UC Berkely(82)等包括大学、研究机构、企业在内的单位也榜上有名。

那么,最终的论文收录情况如何呢?

目前ICCV2019官方只公布了收录论文的编号,我们未能检索到所有论文原文,因此论文所属机构按照第一作者单位来统计(实际各个单位的收录论文要比以下数量多)。

据不完全统计,在中国科研机构中,有以下单位入围高选榜单。

果然是投递的多,中的也多。

中科院论文入选情况最佳,清华大学依旧势不可挡,紧随其后,北大也表现不俗。

紧接着华中科大、大连理工、中国科学技术大学、上海交通大学、中山大学占据第二梯队。

天大、南开、北邮、西交大、南大等高校都有不错的表现。

从中国工业届来看,按照一作所属机构,据不完全统计,百度有5篇,华为4篇,阿里巴巴4篇,Pony.ai也有1篇入选。

而从媒体的报道中,我们也可以了解到,腾讯优图13篇论文入选,商汤科技12篇,旷视科技有11篇论文入选,深睿研究院共有5篇论文入选,还有其他不少AI公司也有论文入选。

以上粗略统计也可以看出,中国企业本届ICCV取得了可喜的成绩。同时多所高校联合或以产学研形式合作越来越普遍,很多入选论文都是高校与企业高效合作的结晶,比如华为、北大合作首创GAN剪枝算法,大连理工、鹏城实验室与香港城大出品的首个镜子分割网络,都取得了亮眼的成果。

从一家独大到抱团合作,也许以开放的心态寻求合作与机会,才能在这条路上走得更远。

在国外科研机构中,有以下单位列入高选榜单。

从工业界来看,谷歌与Deepmind共有20篇入选。

Facebook有17篇入选。NVIDIA有6篇入选。微软6篇。亚马逊4篇。三星4篇。

从中外对比来看,本届ICCV也几乎成了中美两国的直接PK,而这种竞争形势也将越来越激烈。

华人表现亮眼

本届ICCV2019的华人表现令人惊喜。

在1077篇总入选论文中,华人以一作身份入选的有523篇,占比总录用48.6%。

其中,华人学生总共有326篇,占比华人作者的62%,占比总录用30.3%。

可以看出,华人力量几乎占据了ICCV的半壁江山,可谓全面崛起。

而从中国机构参与情况统计,来自学术界和工业界的同样亮点多多,比如有9篇论文入选的大牛,大多数都是华人。国内许多高校也开始在人工智能方向发力,都有多篇论文入选。

大牛和新星涌现

除了以上已经列出的计算机视觉领域的大牛,还有以下学者的表现也尤为亮眼。

Leonidas J. Guibas

斯坦福大学计算机科学系教授Leonidas J. Guibas,共有8篇论文入选。他署名的文章曾在CVPR2018获得最佳论文。Guibas师从图灵奖得主Donald Knuth,是ACM/IEEE Fellow,美国工程院院士。他在数据结构、算法分析以及计算几何方面具有深厚造诣,知名学术成果包括红黑树、Voronoi-Delaunay算法、Finger Trees和Fractional Cascading等。

贾佳亚

香港中文大学终身教授、腾讯优图杰出科学家、IEEE  Fellow贾佳亚此次同样有8篇论文入选。2017年5月,贾佳亚加盟腾讯优图实验室,作为杰出科学家,负责计算机视觉图像处理模式识别机器学习人工智能领域的研究。在他的带领下,优图实验室在ICCV2017有12篇论文入选,今年有13篇入选,居业界实验室前列。

Devi Parikh

计算机视觉领域杰出的女性科学家、Facebook人工智能研究院(FAIR)首席科学家Devi Parikh此次共有7篇署名文章入选。说起Devi Parikh,她不仅是IJCAI 计算机和思想奖(国际人工智能领域的「菲尔兹奖」)的获得者,还是2011年ICCV马尔奖获得者,并位列福布斯 2017 年「20 位引领 AI 研究的女性」榜单。她还两次获得CVPR最佳论文奖,先后在计算机视觉三大顶级会议发表论文数十篇,其中以第一作者发表论文多篇。

而受到抄袭质疑的南开大学程明明教授,也有7篇论文入选。

计算机视觉大神何凯明本次有5篇论文入选,其中一作身份一篇。

本届ICCV,又涌现出了哪些学术新星呢?

悉尼科技大学博士生董宣毅,此次以一作身份发文两篇。董宣毅,2016年获得北京航空航天大学计算机博士学位,目前是UTSReLER实验室的三年级博士生。师从杨易教授,他的研究还获得了Google博士奖学金(2019)的支持。迄今为止,他已在CCF A会议或CCF A期刊(包括TPAMI,TIP和CVPR)上发表了十多篇论文。他是CVPR 2019、ICCV 2019和ACM MM 2017-2018的程序委员会成员。他的研究兴趣包括自动化机器学习及其在计算机视觉中的应用。

聂学成,本届ICCV以一作身份发文两篇。他是颜水成和冯佳时联合指导的博士生,目前正在新加坡国立大学进行计算机视觉方面的研究工作,并在顶会顶刊上发表过多篇优秀论文。此次收录的《Single-Stage Multi-Person Pose Machines》一文,也是颜水成教授加盟依图科技后的首篇顶会论文,这篇论文从全新的角度处理了单图像多人姿态检测的问题,大幅度提高了人体位姿检测的效率和精度。

看完了以上分析,是否有种观看行业风起云涌的赶脚?不论论文是否中选,在人工智能以此种增长速度和竞争强度下,不论你处于哪个level,未来该如何自处,如何在竞争中占据有利位置,值得每个从业者深思。

最后,文中数据统计不全,欢迎大家留言补充,不甚感激!

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
产业ICCV 2019论文
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
依图科技机构

依图是一家世界领先的人工智能公司,以AI芯片和算法技术为核心,研发及销售含AI算力硬件和软件在内的AI解决方案,全面解决机器看、听、理解和规划的根本问题,为AI发展和应用普及提供高性能、高密度和通用算力,满足云端数据中心、边缘计算和物联网不断增长智能计算需求,并将芯片技术与算法技术结合,形成在AI算力技术及产品领域的领先优势。在AI芯片领域,创新芯片架构通过融合通用计算和深度学习计算实现端到端处理能力,具备高性能及低功耗优势。在AI算法领域,在计算机视觉、语音和自然语言理解等领域处世界前列。

https://www.yitutech.com
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商,我们致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界:让无处不在的联接,成为人人平等的权利;为世界提供最强算力,让云无处不在,让智能无所不及;所有的行业和组织,因强大的数字平台而变得敏捷、高效、生机勃勃;通过AI重新定义体验,让消费者在家居、办公、出行等全场景获得极致的个性化体验。目前华为约有19.4万员工,业务遍及170多个国家和地区,服务30多亿人口。

https://www.huawei.com/cn/
商汤科技机构

商汤科技作为全球领先的人工智能平台公司,商汤科技SenseTime是中国科技部指定的“智能视觉”国家新一代人工智能开放创新平台。同时,商汤科技也是全球总融资额及估值最高的人工智能创新企业。 商汤科技以“坚持原创,让AI引领人类进步”为愿景。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为亚洲最大的AI算法提供商。 商汤科技在多个垂直领域的市场占有率位居首位,业务涵盖智能手机、互联网娱乐、汽车、智慧城市、以及教育、医疗、零售、广告、金融、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的企业和机构建立合作,包括本田、SNOW、阿里巴巴、苏宁、中国移动、OPPO、vivo、小米、微博、万科、融创等。

http://www.sensetime.com
Microsoft机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
Stanford University - Computer Science Department机构

斯坦福大学计算机科学系隶属于工程学院,提供理学学士、理学硕士和哲学博士学位。它还参与了以下本科跨学科项目:计算机系统工程、符号系统、数学和计算科学。计算机科学系成立于1965年,是本科和研究生阶段的研究和教育中心。强大的研究团队致力于人工智能、机器人学、计算机科学基础、科学计算和系统领域的研究。计算机科学的基础工作是这些小组的主要研究目标,但是也非常强调跨学科研究和促进基础研究的应用。跨学科工作涉及化学、遗传学、语言学、物理学、医学以及工程、建筑和制造等各个领域。该系与大学其他系中对计算机感兴趣的研究人员保持密切联系。此外,教师和学生通常与附近研究机构或行业机构的调查人员一起工作。主要的教育目标是让学生为学界或业界的研究和教学职业做好准备。

颜水成人物

颜水成,新加坡国立大学副教授、360集团副总裁、人工智能研究院院长、第十三批国家 "千人计划"专家。颜水成的主要研究领域包括计算机视觉、深度学习、信息检索应用与多媒体分析。他带领的团队曾提出的“Network in Network” ,对深度学习产生了很大的推动力,同时他的团队开发的”Purine”是全球第一个开源的支持多机多GPU的深度学习系统。

贾佳亚人物

香港中文大学计算机科学工程系终身教授,腾讯优图实验室杰出科学家。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

剪枝技术

剪枝顾名思义,就是删去一些不重要的节点,来减小计算或搜索的复杂度。剪枝在很多算法中都有很好的应用,如:决策树,神经网络,搜索算法,数据库的设计等。在决策树和神经网络中,剪枝可以有效缓解过拟合问题并减小计算复杂度;在搜索算法中,可以减小搜索范围,提高搜索效率。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

语义分割技术

语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类。图像语义分割是AI领域中一个重要的分支,是机器视觉技术中关于图像理解的重要一环。

生成对抗网络技术

生成对抗网络是一种无监督学习方法,是一种通过用对抗网络来训练生成模型的架构。它由两个网络组成:用来拟合数据分布的生成网络G,和用来判断输入是否“真实”的判别网络D。在训练过程中,生成网络-G通过接受一个随机的噪声来尽量模仿训练集中的真实图片去“欺骗”D,而D则尽可能的分辨真实数据和生成网络的输出,从而形成两个网络的博弈过程。理想的情况下,博弈的结果会得到一个可以“以假乱真”的生成模型。

红黑树技术

红黑树(英语:Red–black tree)是一种自平衡二叉查找树,是在计算机科学中用到的一种数据结构,典型的用途是实现关联数组。它是在1972年由鲁道夫·贝尔发明的,他称之为"对称二叉B树",它现代的名字是在Leo J. Guibas和Robert Sedgewick于1978年写的一篇论文中获得的。

自动化机器学习技术

机器学习最近在许多应用领域取得了长足的进步,这促成了对机器学习系统的不断增长的需求,并希望机器学习系统可以被新手快速地熟悉并使用。相应地,越来越多的商业企业推出产品旨在满足这种需求。这些服务需要解决的核心问题是:在给定数据集上使用哪种机器学习算法、是否以及如何预处理其特征以及如何设置所有超参数。这即是自动化学习(AutoML)企图解决的问题。

阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。 阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。 2014年9月19日,阿里巴巴集团在纽约证券交易所正式挂牌上市,股票代码“BABA”,创始人和董事局主席为马云。 2018年7月19日,全球同步《财富》世界500强排行榜发布,阿里巴巴集团排名300位。2018年12月,阿里巴巴入围2018世界品牌500强。

https://www.alibabagroup.com/
相关技术
百度机构

百度是全球领先的人工智能平台型公司。百度大脑是中国领先的“软硬一体AI大生产平台”,是百度AI的集大成,对外全方位输出超过270多项核心AI能力,服务230万开发者。飞桨是中国首个全面开源开放、功能完备的产业级深度学习平台,是中国自主研发的“智能时代的操作系统”。百度智能云是百度AI To B 业务的重要承载者和输出者,是产业智能化领导者。小度助手是中国领先的对话式人工智能操作系统,拥有中国市场最繁荣、开放的对话式人工智能生态,今年6月,小度助手语音交互次数超过58亿次。作为全球领先的、最活跃的自动驾驶开放平台,百度Apollo代表中国最强自动驾驶实力,被知名研究公司Navigant Research列为全球四大自动驾驶领域领导者之一。目前聚焦在以自动驾驶、汽车智能化、智能交通为核心的三大赛道。自动驾驶技术方面,超过十项中国第一,实力领跑行业。智能交通方面,百度 “ACE交通引擎”是全球首个车路行融合的全栈式智能交通解决方案。

https://www.baidu.com/
Samsung Group机构

三星集团是韩国最大的跨国企业集团,同时也是上市企业全球500强,三星集团包括众多的国际下属企业,旗下子公司有:三星电子、三星物产、三星航空、三星人寿保险、雷诺三星汽车等,业务涉及电子、金融、机械、化学等众多领域。 三星集团成立于1938年,由李秉喆创办。三星集团是家族企业,李氏家族世袭,旗下各个三星产业均为家族产业,并由家族中的其他成员管理,集团领导人已传至 李氏第三代,李健熙为现任集团会长,其子李在镕任三星电子副会长。

旷视科技机构

旷视成立于2011年,是全球领先的人工智能产品和解决方案公司。深度学习是旷视的核心竞争力,我们打造出自研的AI生产力平台Brain++并开源其核心——深度学习框架“天元”,实现了算法的高效开发与部署。在持续引领技术进步的同时,我们推动AI产业的商业化落地,聚焦个人物联网、城市物联网、供应链物联网三大赛道,为个人用户带来更出色的美学体验与安全保障、让城市空间更有序、并帮助企业实现工业、仓储数字化升级。我们提供包括算法、软件和硬件产品在内的全栈式、一体化解决方案。

https://www.megvii.com
腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。 腾讯希望成为各行各业的数字化助手,助力数字中国建设。在工业、医疗、零售、教育等各个领域,腾讯为传统行业的数字化转型升级提供“数字接口”和“数字工具箱”。我们秉持数字工匠精神,希望用数字创新提升每个人的生活品质。随着“互联网+”战略实施和数字经济的发展,我们通过战略合作与开放平台,与合作伙伴共建数字生态共同体,推进云计算、大数据、人工智能等前沿科技与各行各业的融合发展及创新共赢。多年来,腾讯的开放生态带动社会创业就业人次达数千万,相关创业企业估值已达数千亿元。 腾讯的愿景是成为“最受尊敬的互联网企业”。我们始终坚守“科技向善”的初心,运用科技手段助力公益事业发展,并将社会责任融入每一个产品。2007年,腾讯倡导并发起了中国互联网第一家在民政部注册的全国性非公募基金会——腾讯公益慈善基金会。腾讯公益致力于成为“人人可公益的创连者”,以互联网核心能力推动公益行业的长远发展为己任。腾讯公益联合多方发起了中国首个互联网公益日——99公益日,帮助公益组织和广大爱心网友、企业之间形成良好的公益生态,让透明化的“指尖公益”融入亿万网民的生活。

http://www.tencent.com/
目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

姿态检测技术

姿态检测是指主体对主要行为者提出的主张的反应。它是假新闻评估的一套方法的核心部分。

人体姿态估计技术

人体姿态估计是计算机视觉领域的一个重要问题,主要用于跟踪一个人的每一个小动作并实时进行生物力学分析。

小样本学习技术

人类非常擅长通过极少量的样本识别一个新物体,比如小孩子只需要书中的一些图片就可以认识什么是“斑马”,什么是“犀牛”。在人类的快速学习能力的启发下,研究人员希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,这就是 Few-shot Learning 要解决的问题。

生成对抗技术

生成对抗是训练生成对抗网络时,两个神经网络相互博弈的过程。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。

推荐文章
暂无评论
暂无评论~