Guosheng Hu作者知乎专栏来源

关于本次CVPR2019投稿的一些感想

胡国圣,英国ANYVISION公司研究员,研究方向是深度学习人脸识别

本文转载自胡国圣博士的知乎文章"关于本次CVPR 2019投稿的一些感想"。未经允许,不得二次转载,原文链接:https://zhuanlan.zhihu.com/p/50263270。

关于本次CVPR2019投稿的一些感想

背景: 一年一度的CVPR是人工智能的机器视觉方向最重要的学术会议,每年吸引了全球最顶尖的大学和公司的研究人员投稿,文章如果被录用,通常认为你在你的研究子方向达到了国际领先水平,是对研究人员水平的一个肯定。如果中过CVPR这种顶会论文,对学生找工作,老师申请项目,公司做PR都有很大的帮助,CVPR论文甚至是一些AI初创公司估值的重要组成部分。所以,中一篇CVPR意义挺重大。

关于本次CVPR投稿简单说一下自己的看法:

1. 今年收到投稿7100+篇, 有效投稿5165篇,比去年增加56% (图1,华刚老师的统计). 巨大利益的推动,从业人员大增, 投稿量大增, 论文的在线协同编辑工具overleaf一度因为编辑人太多而崩溃(图2). 现象的背后是,国家制定人工智能战略, 各大高校纷纷成立人工智能独立学院, 很多原计算机学院的AI方向的硕博名额也大增. 学生们纷纷转专业学AI考AI,转不了专业的也在自学AI. 一群搞数学的, 物理的, EE的, 机械的, 生物的都在转. 还有一大批物理数学奥赛(国际/国家/省赛)金奖银奖选手也加入竞争.华南理工谭明奎教授评论: 当硬件领域的摩尔定律逐渐因为硬件极限而失效的时候,paper发表数量接了班(图3).

2. 马毅老师的微博(图4)同样引起了热议: 伯克利的马毅老师和六十多岁的Malik教授为了赶deadline深夜和学生一起奋战, 讨论论文, 修改论文.

3. 大佬们生活离我远一些, 那些岁数差不多的高校教师呢? 一大批青年教师, 名校毕业, 受过非常系统的科研训练, 水平高. 同时又非常有责任心,非常拼命. 赶论文时, 跟几个青年老师简单沟通了一下, 他们最后一个星期基本每天晚上睡个3-4个小时,然后最后一天通宵干到论文截止.

4. 学生们就不用说啦. 这次跟国内老师合作的一篇论文, 我晚上下班后帮学生改论文, 需要不停跟学生讨论并交互. 由于8小时的时差, 我晚上的工作的时候, 他在国内已经下半夜啦. 我工作到12点, 我问学生什么时候睡. 学生说, 会一直陪我到我这边12点(国内早上8点).

5. 老师学生的强度都非常大,熬夜高强度工作,以致于论文群里的深研院的彭小江老师非常严肃地分享了医生给他的心梗自救-自我心肺复苏的一些方法(图5,6). 大家这才意识到自己在玩儿命.


6. 现在论文的集团化作战现象明显, 分工明确, 有人找创新点, 有人定方向, 有人做实验, 有人写论文. 写论文还分为有人写方法论,有人写introduction, 有人负责画图. 每个模块都有最牛逼的人做. 有好几个特别牛逼的组, 学生只需要提供实验结果, 非常有经验的老师和博后会把文章从0给写完. 我个人认为, 培养一个博士生, 研究生, 你应该让他学会:找点, 实验, 写作, 搞全套科研. 但现在的情况是,大家都集团作战,你自己慢慢搞全套必然慢一些, 很容易吃亏.

7. 这种集团化作战的结果就是, 马太效应加剧, 强者越强, 弱者越弱. 工业化大生产碾压小作坊, 以个人力量对抗一个个有经验有资源的大组, 结果就是,小的组和闭门造车的个人发表顶级论文的可能性越来越低.

8. 这次投稿跟很多组进行了交流, 有经验的组和没有经验的组的一个主要区别是时间管理的不同. 有经验的组,会要求学生一个月之前提交论文初稿,这样老师会有足够的时间跟学生讨论并提高论文. 没有经验的组, 学生提前一个2,3天完成初稿, 老师跟学生累死了,论文质量还没有保证. 建议: 老师应该给组里学生一个hard的截止日期, 比如提前一个月, 或提交2个星期, 如果学生在那之前不能提交初稿, 要放弃那篇论文.

9. 很多老师到最后都累在帮学生写论文或改论文上,毕竟创新和实验部分前期都完成啦. 大部分学生做实验都很好, 但很多学生对论文写作没有系统锻炼过, 论文呈现出来的逻辑简直惨不忍睹. 很多老师都跟我在抱怨这个问题,一个老师直接告诉我:"看到学生的初稿后, 我真是shock啦, 彻彻底底的shock啦", 我相信很多老师看到自己学生写的论文都有这个感受:(

10. 最后给大家留个彩蛋, 开心一下: 我帮一个合作学生改论文时, 他论文写了'improve 3 points', 我读的时候不太明白, 看看表格里的数据, 提升了3%, 原来他把汉语土话中的'提升了三个点'按字面意思翻译了一下. 看完后, 我出去喝了一大杯水压了压惊. 最后给学生起了个外号叫'三个点'.

最后的最后, 祝大家CVPR论文高中. 如果没中的话, 也多放宽心, 看看你竞争对手的豪华阵容. 投稿前, 尽全力做好自己能做好的, 每个细节都尽力啦, 问心无愧就好啦. 有幸与世界最聪明的人同台竞技, 一起观看行业的风起云涌, 也是我辈幸运. 同时,人工智能这种增长速度和竞争强度, 值得每个从业者深思(不管你处于那个LEVEL), 你如何自处, 说得糙点, 你如何活下来并寻求发展? 占据有利位置的, 你如何保住自己的位置.

理论计算机视觉学术会议CVPR 2018
相关数据
华刚人物

华刚博士是微软亚洲研究院资深研究员,现任微软亚洲研究院计算视觉组负责人。他的研究重点是计算机视觉、模式识别、机器学习、人工智能和机器人,以及相关技术在云和移动智能领域的创新应用。

马毅人物

加州大学伯克利分校电气工程与计算机科学系教授,BAIR成员。研究兴趣:计算机视觉、高维数据的低维模型、可扩展优化和机器学习、智能机器。近期研究低维模型和深度网络之间的关系、高维数据的稀疏表征和低秩近似、高维数据的聚类和分类、3D图像重建。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

摩尔定律技术

摩尔定律是由英特尔创始人之一戈登·摩尔提出来的。其内容为:积体电路上可容纳的电晶体数目,约每隔两年便会增加一倍;经常被引用的“18个月”,是由英特尔首席执行官大卫·豪斯所说:预计18个月会将芯片的性能提高一倍。

推荐文章
暂无评论
暂无评论~