Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

R-CNN作者Ross Girshick离职,何恺明、谢赛宁回归学界,Meta CV走出了多少大神

Yann LeCun 表示:「人才离开 FAIR 是我们的损失,但自己仍为他们感到高兴」。

FAIR 又一位大佬级研究科学家「出走了」,这次是 R-CNN 作者 Ross Girshick。

近日,Meta 首席科学家 Yann LeCun 发推宣布,Ross Girshick 将离开 FAIR,加入艾伦人工智能研究所(AI2)。此前离职的还有 ResNeXt 一作谢赛宁(加入纽约大学任助理教授)、Georgia Gkioxari(加入 Caltech 任助理教授)等。

图片

图源:https://twitter.com/ylecun/status/1730713022195470541

我们查了一下 Ross Girshick 的个人主页,证实了他从 FAIR 离职的消息。他将于 2024 年初入职 AI2。

图片

AI2 的计算机视觉高级总监 Ani Kembhavi 表示,Ross Girshick 届时将加入 PRIOR 团队。PRIOR 全称为感知推理和交互研究,为 AI2 的计算机视觉研究团队,致力于推进计算机视觉研究,以创建能够看到、探索、学习和推理世界的 AI 系统。

图片

图源:https://twitter.com/anikembhavi/status/1730655170038821085

Ross Girshick 发文追忆其在 Meta 的职业生涯,表示 FAIR 过去是、将来仍是一个令人惊叹的地方。不过在一个地方呆了太长时间(8 年)或许是促使他离开的不错理由,重新初始化和随机化在研究生涯中非常重要。此外,他还声明任何有关发表指标的言论纯属无稽之谈。

图片

图源:https://twitter.com/inkynumbers/status/1730735493711810639

其实,加上今年 7 月底宣布回归学界,将于 2024 年加入麻省理工学院(MIT)电气工程与计算机科学系 EECS 担任教职的何恺明,FAIR 近年来已经走出了很多 CV 领域的大佬。

图片

Yann LeCun 表示,他们的离开对 FAIR 是损失,但自己为他们感到高兴。他认为工业实验室的科学家转投学术界或非营利组织绝对没有错。对于一些人来说,这是自然的职业转变。

LeCun 还举了贝尔实验室的例子,该实验室相当一部分科学家会在 5 到 10 年后离开,并在一个不错的大学获得终身教职(完全跳过了艰难的谋求终身教职的过程)。在人生的不同阶段,优先项会发生改变。在工业界待久了的人可能想去教学,与学生待在一起,享受教学带来的直接回报。

事实上,人们可以在 FAIR 工作几年后获得学界的终身教职,这是一个特点,而不是缺陷。这种转变在 FAIR 是可能的,就像贝尔实验室一样,FAIR 实行开放的研究并鼓励科学家发表论文。

这意味着人们在 FAIR 开始自己的职业生涯不会冒任何风险,选择是自由的。从业界到学界并拓展研究生态系统,这是一件好事。

LeCun 还提到,过去几年,很多才华横溢的年轻计算机科学家选择加入 FAIR,比如 Ishan Misra、Nicolas Carion、Xinlei Chen、Christoph Feichtenhofer 等。

人才流出流进是再正常不过的事情,很多人将自己从舒适区域「踢」了出来。不过也有人认为,AI 大佬接连离开 FAIR 可以对其现状窥知一二。

图片

图源:https://twitter.com/LearnOpenCV/status/1730736970136158274

这一年来,Meta 先后开源了 Llama、Llama 2 系列大模型,成为开源社区的中坚力量。但 Meta 在留住 AI 人才方面也面临很多挑战,人才的外流不可避免。像 Ross Girshick 这样在工业界积累了丰富经验的科学家进入大学或非营利机构,会为学界带来一些不一样的东西,并有可能做出更有影响力的研究。

RBG 大神:Ross Girshick 介绍

图片

个人主页:https://www.rossgirshick.info/

此前,Ross Girshick 是 Meta FAIR 的研究科学家,2015 年至 2023 年期间致力于计算机视觉机器学习的研究。他于 2012 年获得了芝加哥大学计算机科学博士学位。

在加入 FAIR 之前,Ross 是微软研究院的研究员,也是加州大学伯克利分校的博士后,在那里他师从 Jitendra Malik 和 Trevor Darrell 教授。

图片

Ross 的研究兴趣包括视觉感知算法(目标识别、定位、分割、姿态估计等)、表征学习(使用强监督、弱监督或根本没有监督的预训练网络)以及视觉和语言研究。

由于他对开源软件和数据集的贡献,Ross 获得了 2017 年 PAMI 青年研究员奖以及 2017 年、2021 年和 2023 年 PAMI Mark Everingham 奖。

Ross 在 AI 界可谓是战果累累,他最初因开发 R-CNN(基于区域的卷积神经网络目标检测方法而闻名,这项研究可以说是改变了目标检测领域的研究思路,之后的其他研究 Fast-RCNN、Faster-RCNN 都沿袭了 R-CNN 的思路。

现在他的谷歌学术引用超过 41 万次。

图片

在 Ross 过往参与的工作中,有很多热门研究,如 Fast R-CNN、Mask R-CNN、YOLO、Faster R-CNN、SAM 等。

2017 年,Ross 参与的 Mask R-CNN 获得了 ICCV 马尔奖(最佳论文),现在这篇论文的引用量达 3 万多次;另一篇论文《Focal Loss for Dense Object Detection》获得当年 ICCV 最佳学生论文。

图片

2021 年,Girshick 参与的论文《Masked Autoencoders Are Scalable Vision Learners》成为了计算机视觉圈的热门话题。这篇论文展示了一种被称为掩码自编码器(masked autoencoders,MAE)的新方法,可以用作计算机视觉的可扩展自监督学习器。

今年,Meta 发布了「分割一切」(Segment Anything)模型(SAM),被很多人誉为颠覆传统 CV 领域的研究,Ross 是这篇论文的作者之一。

如今选择去 AI2,期待 Girshick 能带来更多惊艳之作。

产业FAIRRoss GirshickYann LeCun
相关数据
何恺明人物

Facebook AI Research研究科学家。Residual Net提出者。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

表征学习技术

在机器学习领域,表征学习(或特征学习)是一种将原始数据转换成为能够被机器学习有效开发的一种技术的集合。在特征学习算法出现之前,机器学习研究人员需要利用手动特征工程(manual feature learning)等技术从原始数据的领域知识(domain knowledge)建立特征,然后再部署相关的机器学习算法。虽然手动特征工程对于应用机器学习很有效,但它同时也是很困难、很昂贵、很耗时、并依赖于强大专业知识。特征学习弥补了这一点,它使得机器不仅能学习到数据的特征,并能利用这些特征来完成一个具体的任务。

YOLO技术

YOLO 模型最早是由 Joseph Redmon 等人在 2015 年发布的,并在随后的两篇论文中进行了修订。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

基于区域的卷积神经网络技术

OpenCV技术

OpenCV的全称是Open Source Computer Vision Library,是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。

目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

姿态估计技术

姿势估计是指检测图像和视频中的人物形象的计算机视觉技术,以便确定某人的某个肢体出现在图像中的位置。

自监督学习技术

一个例子中的内容特别多,而用一个例子做一个任务,就等于把其他的内容浪费了,因此我们需要从一个样本中找出多个任务。比如说遮挡图片的一个特定部分,用没遮挡部分来猜遮挡的部分是一个任务。那么通过遮挡不同的部分,就可以用一个样本完成不同任务。Yann Lecun描述的这个方法被业界称作「自监督学习」

推荐文章
暂无评论
暂无评论~