从第一台计算机共同成长为AI大牛,Bengio兄弟不为人知的故事

今年 3 月底,ACM 公布了 2018 年的图灵奖获得者,Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun 三位深度学习巨头因在深度神经网络概念和工程上的突破而得奖。

在 NeurIPS 2018 期间,AI 播客 Eye on A.I. 对深度学习三巨头之一的 Yoshua Bengio(2018 图灵奖得主之一),以及他同为 AI 领域大牛的弟弟 Samy Bengio 共同进行了采访。这是兄弟二人第一次共同接受采访。

Eye on A.I. 是由前纽约时报资深记者及高管 Craig S. Smith(Twitter handle: craigss)主持的一档双周播客节目。每一期节目,Craig 都将与这一领域有影响力的人物进行交流,推进广义环境中的机器智能新发展,思考技术发展新蕴意。机器之心为 Eye on A.I. 的中文合作方。

毫无疑问,Yoshua Bengio 等人不懈努力地推动神经网络实现了今日的成就。但在 AI 领域之外,很少有人知道 Yoshua 只是共同进军机器学习的两兄弟中的一个。他的兄弟 Samy 是 Yoshua 早期研究的合作者,现在也已经成为了该领域最突出的计算机科学家之一。在博士毕业,并投身学界一段时间后,Samy 加入了谷歌大脑,他现在在谷歌领导着一个专注理解神经网络工作方式的团队。而 Yoshua 则在蒙特利尔大学创立了 MILA,以及为产业界研发 AI 产品的公司 Element AI。

该对话谈到了 Bengio 兄弟不拘泥于传统教育方式的生活、到手的第一台计算机(Atari 800)、在神经网络方面的早期合作以及他们眼中未来的挑战。

作为兄弟和亲密的研究伙伴,Yoshua 和 Samy Bengio 是一同开始对于计算机的兴趣的,他们很小的时候就从一台 Atari 800 开始,用 Basic 语言编程,并将程序保存在磁带上(那时甚至连软盘都没有出现)。

两人在大学期间都选择了计算机科学作为自己的专业,Samy 在蒙特利尔大学学习,而 Yoshua 去了麦吉尔大学。到了 1985 年,还在念研究生的 Yoshua Bengio 接触到了 Geoffrey Hinton 等人有关神经网络的论文,并产生了兴趣。几年后在 Yoshua 的介绍下 Samy 也对这一方向产生了兴趣。在 AI 还处于低潮期的时代,两人共同开始了自己的研究。

两人当年一同讨论的重要技术之一,Samy 毕业论文主题,就是现在 AI 领域里大热的 AutoML

在「AI 寒冬」的时代,坚持研究神经网络是难能可贵的。「我有点固执,非常相信自己的眼光。」Yoshua Bengio 表示,「我当时觉得每个人都是错的,而我是对的。我想坚持下来的另一个原因就是我有几个同样拥有信念的朋友,如 Yann LeCun 和 Geoffrey Hinton。而当身处一个最终将其确定下来的支持网络(加拿大高等研究院 CIFAR)时,整个世界都不一样了——这真的能从心理上帮助你专注于所选择的方向。」

而 Samy Bengio 表示:「这个领域显然还有更多事情需要研究和理解,我们不需要和其它人做一样的事情,我们想要继续研究它。」

想了解这对 AI 兄弟更多不为人知的成长故事,点击上面视频吧

产业图灵奖Samy BengioYoshua Bengio
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~