1人15篇入选?华人论文知多少?深度分析ICCV2019论文录取背后的那些事儿!

你要问,有什么能把全球人工智能圈子里的科技巨头公司和技术大牛们聚集到一起?

自然是AI顶会啦!

本周日,ICCV2019将在韩国首尔正式拉开帷幕。

据早前公布的投稿数量显示,中国高校和企业在今年的ICCV是大放异彩。因此,今年的大会显得格外令人期待。

据悉,在30年ICCV大会历史上,上一届ICCV堪称火爆出奇的一届,参会人数达到3107名。

而时隔两年后,本届ICCV又会出现怎样的盛况呢? 上届ICCV,何凯明团队包揽2项ICCV 2017最佳论文奖,而今年他们会再创佳绩吗?

我们拭目以待!

详解ICCV2019

按照ICCV官方披露信息,今年共计收到4328篇论文投稿--这一数量是上一届( ICCV 2017) 的两倍。其中总共有1077篇论文入选,接收率为25.02%。  

因投稿人数的激增,可能直接导致了今年的接收率比去年降低了将近4%。

而跟隔壁CVPR相比,两者的录取率虽然看起来差别不大,但是相比CVPR一年一次的频率,ICCV两年才举办一次,通过率其实更低。

下图显示了2011至今以来ICCV接收的论文投稿数和最终录用数对比情况。

整体上看,ICCV的投稿论文数逐年递增趋势非常明显,从2011年至2019年,投稿数翻了3倍,但是接收率近几年却有小幅下滑。

可见随着AI的爆发导致各类研究方向的火热,ICCV的论文接收难度也会有所提高。

我们对论文题目的关键词进行了提取,词云图如下:

ICCV2019的关键词主要集中在行人重识别、目标检测语义分割、图像理解、人体姿态估计生成对抗网络、视频目标检测卷积神经网络小样本学习等领域,以上方向也是近年来计算机视觉研究的热点。

从作者维度分析

从作者维度统计分析,被接收的1077篇论文,总共来自3700位科研人员。

其中有3078位作者1篇入选, 393位作者2篇入选,111位作者3篇入选,51位4篇入选,23位5篇入选,19位6篇入选,11位7篇入选,5位8篇入选。

六篇以上论文入选的学者见下图:

单人9篇以上入选的共有9人。

其中商汤研究院院长、香港中文大学副教授王晓刚,深度学习计算机视觉领域专家、悉尼大学高级讲师欧阳万里,ICCV2017杰出研究者获得者、瑞士苏黎世联邦理工学院(ETH Zurich)计算机视觉教授 Luc van Gool ,CVPR2019大会主席、马里兰大学教授Larry Davis,大连理工大学卢湖川教授,澳大利亚科学院院士、悉尼大学陶大程教授都是九篇入选。

邵岭

入选论文最多的荣誉属于阿联酋国家级“起源人工智能研究院”(IIAI)CEO兼首席科学家邵岭博士,他曾是英国东安格利亚大学计算机学院的教授,英国计算机学会 Fellow、IET Fellow、IEEE 高级会员以及 ACM 终身会员。他署名投稿的论文,共有15篇被接收。而本届ICCV,IIAI成绩斐然,共有28篇论文入选。

入选论文排名第二的有两位大牛,分别都有10篇论文入选;一位是悉尼科技大学教授杨易,去年加入了百度研究院;另一位是IEEE Fellow、华为诺亚方舟实验室计算视觉首席科学家田奇,他曾是美国德克萨斯大学圣安东尼奥分校计算机系教授。

按照论文的作者个数来看,最多署名的是4人,共有272篇;其次是是3人与5人,各有202和222篇。仅有3篇论文拥有唯一作者,还有1篇竟有17人署名,以14人署名的也有1篇。

按照第一作者来看,共有35位研究人员以一作身份发文2篇。

从作者所属机构分析

虽然早在今年3月,ICCV2019就在官方推特公布了23个论文投稿单位,其中来自中国的单位有:中科院、清华大学、华为百度,分别以237、175、91、47篇的投稿数量位列第1、第2、第6和第15位。

此外,微软(103)、谷歌(100)、苏黎世联邦理工学院(99)、Facebook(85)、UC Berkely(82)等包括大学、研究机构、企业在内的单位也榜上有名。

那么,最终的论文收录情况如何呢?

目前ICCV2019官方只公布了收录论文的编号,我们未能检索到所有论文原文,因此论文所属机构按照第一作者单位来统计(实际各个单位的收录论文要比以下数量多)。

据不完全统计,在中国科研机构中,有以下单位入围高选榜单。

果然是投递的多,中的也多。

中科院论文入选情况最佳,清华大学依旧势不可挡,紧随其后,北大也表现不俗。

紧接着华中科大、大连理工、中国科学技术大学、上海交通大学、中山大学占据第二梯队。

天大、南开、北邮、西交大、南大等高校都有不错的表现。

从中国工业届来看,按照一作所属机构,据不完全统计,百度有5篇,华为4篇,阿里巴巴4篇,Pony.ai也有1篇入选。

而从媒体的报道中,我们也可以了解到,腾讯优图13篇论文入选,商汤科技12篇,旷视科技有11篇论文入选,深睿研究院共有5篇论文入选,还有其他不少AI公司也有论文入选。

以上粗略统计也可以看出,中国企业本届ICCV取得了可喜的成绩。同时多所高校联合或以产学研形式合作越来越普遍,很多入选论文都是高校与企业高效合作的结晶,比如华为、北大合作首创GAN剪枝算法,大连理工、鹏城实验室与香港城大出品的首个镜子分割网络,都取得了亮眼的成果。

从一家独大到抱团合作,也许以开放的心态寻求合作与机会,才能在这条路上走得更远。

在国外科研机构中,有以下单位列入高选榜单。

从工业界来看,谷歌与Deepmind共有20篇入选。

Facebook有17篇入选。NVIDIA有6篇入选。微软6篇。亚马逊4篇。三星4篇。

从中外对比来看,本届ICCV也几乎成了中美两国的直接PK,而这种竞争形势也将越来越激烈。

华人表现亮眼

本届ICCV2019的华人表现令人惊喜。

在1077篇总入选论文中,华人以一作身份入选的有523篇,占比总录用48.6%。

其中,华人学生总共有326篇,占比华人作者的62%,占比总录用30.3%。

可以看出,华人力量几乎占据了ICCV的半壁江山,可谓全面崛起。

而从中国机构参与情况统计,来自学术界和工业界的同样亮点多多,比如有9篇论文入选的大牛,大多数都是华人。国内许多高校也开始在人工智能方向发力,都有多篇论文入选。

大牛和新星涌现

除了以上已经列出的计算机视觉领域的大牛,还有以下学者的表现也尤为亮眼。

Leonidas J. Guibas

斯坦福大学计算机科学系教授Leonidas J. Guibas,共有8篇论文入选。他署名的文章曾在CVPR2018获得最佳论文。Guibas师从图灵奖得主Donald Knuth,是ACM/IEEE Fellow,美国工程院院士。他在数据结构、算法分析以及计算几何方面具有深厚造诣,知名学术成果包括红黑树、Voronoi-Delaunay算法、Finger Trees和Fractional Cascading等。

贾佳亚

香港中文大学终身教授、腾讯优图杰出科学家、IEEE  Fellow贾佳亚此次同样有8篇论文入选。2017年5月,贾佳亚加盟腾讯优图实验室,作为杰出科学家,负责计算机视觉图像处理模式识别机器学习人工智能领域的研究。在他的带领下,优图实验室在ICCV2017有12篇论文入选,今年有13篇入选,居业界实验室前列。

Devi Parikh

计算机视觉领域杰出的女性科学家、Facebook人工智能研究院(FAIR)首席科学家Devi Parikh此次共有7篇署名文章入选。说起Devi Parikh,她不仅是IJCAI 计算机和思想奖(国际人工智能领域的「菲尔兹奖」)的获得者,还是2011年ICCV马尔奖获得者,并位列福布斯 2017 年「20 位引领 AI 研究的女性」榜单。她还两次获得CVPR最佳论文奖,先后在计算机视觉三大顶级会议发表论文数十篇,其中以第一作者发表论文多篇。

而受到抄袭质疑的南开大学程明明教授,也有7篇论文入选。

计算机视觉大神何凯明本次有5篇论文入选,其中一作身份一篇。

本届ICCV,又涌现出了哪些学术新星呢?

悉尼科技大学博士生董宣毅,此次以一作身份发文两篇。董宣毅,2016年获得北京航空航天大学计算机博士学位,目前是UTSReLER实验室的三年级博士生。师从杨易教授,他的研究还获得了Google博士奖学金(2019)的支持。迄今为止,他已在CCF A会议或CCF A期刊(包括TPAMI,TIP和CVPR)上发表了十多篇论文。他是CVPR 2019、ICCV 2019和ACM MM 2017-2018的程序委员会成员。他的研究兴趣包括自动化机器学习及其在计算机视觉中的应用。

聂学成,本届ICCV以一作身份发文两篇。他是颜水成和冯佳时联合指导的博士生,目前正在新加坡国立大学进行计算机视觉方面的研究工作,并在顶会顶刊上发表过多篇优秀论文。此次收录的《Single-Stage Multi-Person Pose Machines》一文,也是颜水成教授加盟依图科技后的首篇顶会论文,这篇论文从全新的角度处理了单图像多人姿态检测的问题,大幅度提高了人体位姿检测的效率和精度。

看完了以上分析,是否有种观看行业风起云涌的赶脚?不论论文是否中选,在人工智能以此种增长速度和竞争强度下,不论你处于哪个level,未来该如何自处,如何在竞争中占据有利位置,值得每个从业者深思。

最后,文中数据统计不全,欢迎大家留言补充,不甚感激!

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
产业论文ICCV 2019
相关数据
亚马逊机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
依图科技机构

依图科技致力于人工智能创新性研究,是全球唯一获得美国国家标准技术局(NIST)、美国国家情报高级研究计划局(IARPA)两项人脸识别世界冠军的企业,在安防、医疗、金融、智慧城市、新零售、芯片等领域推出全球领先的创新技术和产品。 依图科技是国内的最大智能安防服务提供商,是破案最多、覆盖省份最多、服务警种最多的人工智能安防平台;依图是智能医疗领域领军企业,提供全球领先的AI影像辅助诊断系统、AI儿科临床辅助诊断系统和医疗大数据智能平台;依图是智能金融领域市场占有率最高的企业, 2016年全球首推刷脸ATM机,开创无卡交易的金融时代。

https://www.yitutech.com/
华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
商汤科技机构

商汤科技成立于 2014 年,专注于计算机视觉和深度学习的原创技术,是中国领先的人工智能头部公司,估值超过 45 亿美金。以「坚持原创,让 AI 引领人类进步」为使命,商汤科技建立了国内顶级的自主研发的深度学习超算中心,并成为中国一流的人工智能算法供应商。商汤科技不仅在技术实力上领跑行业,商业营收亦领先同行业,在多个垂直领域的市场占有率居首位。目前,商汤科技已与国内外多个行业的 400 多家领军企业建立合作,包括 Qualcomm、英伟达、本田、中国移动、银联、万达、苏宁、海航、中央网信办、华为、小米、OPPO、vivo、微博、科大讯飞等知名企业及政府机构,涵盖安防、金融、智能手机、移动互联网、汽车、智慧零售、机器人等诸多行业,为其提供基于人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等技术的完整解决方案。

www.sensetime.com
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
斯坦福大学计算机科学系机构

斯坦福大学计算机科学系隶属于工程学院,提供理学学士、理学硕士和哲学博士学位。它还参与了以下本科跨学科项目:计算机系统工程、符号系统、数学和计算科学。计算机科学系成立于1965年,是本科和研究生阶段的研究和教育中心。强大的研究团队致力于人工智能、机器人学、计算机科学基础、科学计算和系统领域的研究。计算机科学的基础工作是这些小组的主要研究目标,但是也非常强调跨学科研究和促进基础研究的应用。跨学科工作涉及化学、遗传学、语言学、物理学、医学以及工程、建筑和制造等各个领域。该系与大学其他系中对计算机感兴趣的研究人员保持密切联系。此外,教师和学生通常与附近研究机构或行业机构的调查人员一起工作。主要的教育目标是让学生为学界或业界的研究和教学职业做好准备。

颜水成人物

颜水成,新加坡国立大学副教授、360集团副总裁、人工智能研究院院长、第十三批国家 "千人计划"专家。颜水成的主要研究领域包括计算机视觉、深度学习、信息检索应用与多媒体分析。他带领的团队曾提出的“Network in Network” ,对深度学习产生了很大的推动力,同时他的团队开发的”Purine”是全球第一个开源的支持多机多GPU的深度学习系统。

贾佳亚人物

香港中文大学计算机科学工程系终身教授,腾讯优图实验室杰出科学家。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

剪枝技术

剪枝顾名思义,就是删去一些不重要的节点,来减小计算或搜索的复杂度。剪枝在很多算法中都有很好的应用,如:决策树,神经网络,搜索算法,数据库的设计等。在决策树和神经网络中,剪枝可以有效缓解过拟合问题并减小计算复杂度;在搜索算法中,可以减小搜索范围,提高搜索效率。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

语义分割技术

语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类。图像语义分割是AI领域中一个重要的分支,是机器视觉技术中关于图像理解的重要一环。

生成对抗网络技术

生成对抗网络是一种无监督学习方法,是一种通过用对抗网络来训练生成模型的架构。它由两个网络组成:用来拟合数据分布的生成网络G,和用来判断输入是否“真实”的判别网络D。在训练过程中,生成网络-G通过接受一个随机的噪声来尽量模仿训练集中的真实图片去“欺骗”D,而D则尽可能的分辨真实数据和生成网络的输出,从而形成两个网络的博弈过程。理想的情况下,博弈的结果会得到一个可以“以假乱真”的生成模型。

红黑树技术

红黑树(英语:Red–black tree)是一种自平衡二叉查找树,是在计算机科学中用到的一种数据结构,典型的用途是实现关联数组。它是在1972年由鲁道夫·贝尔发明的,他称之为"对称二叉B树",它现代的名字是在Leo J. Guibas和Robert Sedgewick于1978年写的一篇论文中获得的。

自动化机器学习技术

机器学习最近在许多应用领域取得了长足的进步,这促成了对机器学习系统的不断增长的需求,并希望机器学习系统可以被新手快速地熟悉并使用。相应地,越来越多的商业企业推出产品旨在满足这种需求。这些服务需要解决的核心问题是:在给定数据集上使用哪种机器学习算法、是否以及如何预处理其特征以及如何设置所有超参数。这即是自动化学习(AutoML)企图解决的问题。

阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。 阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。 2014年9月19日,阿里巴巴集团在纽约证券交易所正式挂牌上市,股票代码“BABA”,创始人和董事局主席为马云。 2018年7月19日,全球同步《财富》世界500强排行榜发布,阿里巴巴集团排名300位。2018年12月,阿里巴巴入围2018世界品牌500强。

https://www.alibabagroup.com/
百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
三星机构

三星集团是韩国最大的跨国企业集团,同时也是上市企业全球500强,三星集团包括众多的国际下属企业,旗下子公司有:三星电子、三星物产、三星航空、三星人寿保险、雷诺三星汽车等,业务涉及电子、金融、机械、化学等众多领域。 三星集团成立于1938年,由李秉喆创办。三星集团是家族企业,李氏家族世袭,旗下各个三星产业均为家族产业,并由家族中的其他成员管理,集团领导人已传至 李氏第三代,李健熙为现任集团会长,其子李在镕任三星电子副会长。

旷视机构

旷视科技是以人工智能技术为核心的物联网解决方案提供商,致力于用非凡科技为客户和社会创造最大价值。基于自主原创的AI技术体系,旷视赋能手机、摄像头、机器人等感知设备,让“机器看懂世界”,并通过软硬结合的解决方案构建个人IoT、公共IoT、商业IoT三大物联网络,助力行业实现降本增效,提升客户商业效益和人们生活品质。旷视科技是世界最早一批用深度学习方法实现人脸识别规模化商用的人工智能企业之一,旗下拥有全球领先的人脸识别开放平台Face++和第三方人脸身份验证平台FaceID,并已在多个垂直领域推出了包括人脸识别支付、人脸识别解锁、全帧智能抓拍机在内的多个具有开创性意义的AI产品。 旷视科技在行业的领先地位源于对核心技术持之以恒的创新。作为中国人工智能原创技术企业代表之一,旷视拥有国内外在申及授权专利900余件,并代表行业领先技术提供方参与了19项人工智能国家及行业标准制定。旷视在各项国际人工智能顶级竞赛中多次击败Google、Facebook、Microsoft等知名企业,揽获25项世界技术评测第一,在ECCV2018的COCO、Mapillary竞赛中,旷视独揽4冠,刷新了中国AI技术的世界新高度。旷视科技取得的成绩获得了诸多认可。2014年,旷视被认定为国家级高新技术企业;2015年,旷视被认定为中关村高新技术企业;2016年11月,旷视入选中关村前沿科技企业;2017年3月,旷视被科技部评为“独角兽”企业,并位列人工智能企业首位;2017年5月,旷视核心人脸识别技术被美国著名科技评论杂志《麻省理工科技评论》评定为2017全球十大突破技术,同时旷视入榜“全球最聪明公司”排名第11位;2017年7月,旷视受邀在国家政府半年经济会议中向李克强总理做企业创新汇报;2017年12月,旷视产业级的人工智能技术入选世界互联网领先科技成果;2018年,旷视入选国家知识产权示范企业,获批全国博士后科研工作站一级站点,并承担国家重点研发计划“变革性技术关键科学问题”重点专项核心课题。

腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

http://www.tencent.com/
目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

姿态检测技术

姿态检测是指主体对主要行为者提出的主张的反应。它是假新闻评估的一套方法的核心部分。

人体姿态估计技术

人体姿态估计是计算机视觉领域的一个重要问题,主要用于跟踪一个人的每一个小动作并实时进行生物力学分析。

小样本学习技术

人类非常擅长通过极少量的样本识别一个新物体,比如小孩子只需要书中的一些图片就可以认识什么是“斑马”,什么是“犀牛”。在人类的快速学习能力的启发下,研究人员希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,这就是 Few-shot Learning 要解决的问题。

生成对抗技术

生成对抗是训练生成对抗网络时,两个神经网络相互博弈的过程。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。

推荐文章
暂无评论
暂无评论~