专访Facebook首席技术官,手机上的神经网络可以做到更多

image.png

Facebook CTO Mike Schroepfer:人工智能会让人类更好地利用时间

现在你已经可以在手机上使用神经网络的程序了。上周,Facebook 发布了「风格转移」工具,把实时人工智能视频处理设备装进了手机

让你的视频片段看起来像是《辛普森一家》或者梵高的画作看起来可能有点耍噱头,但要知道,人工智能应用以前极度依赖大型服务器设备才能运转。谷歌在去年把谷歌翻译的神经网络塞进了 app 中。现在 Facebook 开发的深度学习系统 Caffe2Go 则更进一步,可以在 iOS 和安卓平台中实时处理视频,而风格转换技术是用户尝试它的第一个机会。

New Scientist 专访了 Facebook 首席技术官 Mike Schroepfer,采访话题从 Facebook 的人工智能战略、新技术对人们交流方式的影响,到如何将 Facebook 的新闻推送到虚拟现实设备,以及正变得越来越小的地球。


New Scientist:你们是如何将如此高效的神经网络塞进手机里的?

Schroepfer:如果你把神经网络看做是一系列步骤,程序在每个步骤处理信息,随后数据进入下一步骤。从算法的角度来看,我们的目标之一就是在得到同样结果的前提下,减少步骤的数量。所以基本上,构建这一算法的挑战是构建更小的模型,同时保证结果的质量。

第二步就是针对特定的移动设备进行专门优化。即使你有最小的神经网络模型了,如果你想开发一个原生的手机平台应用,这还远远不够。我们有两位非常有趣的科学家,他们试着做了模型压缩,并与真正擅长进行芯片级优化的人合作,这些人尝试了很多不同的技术来优化算法的每个部分,它目前在手机上运行的非常快。

New Scientist:转换视频的艺术风格很有趣,但我们还能用它做什么?

Schroepfer:我们关注图像处理的原因是,尽管它们看起来只是个好玩,简单的应用,但当你以前想要创作点什么,通讯延迟会阻止你的艺术表达欲望,这时候事情就变得。我相信这种解决方法是充分发挥人们创造力的前提。

但还有其他的东西,在我们的演示中你可以看到我们的应用有对象识别功能,所以如果你想把图像中的前景和背景的画面进行不同风格的处理,你也可以做到。

New Scientist:Facebook 还通过训练神经网络做了些什么?

Schroepfer:我们的神经网络系统正在做很多不同的事。我们正用它进行翻译,我们正用它为每天上传的数亿张照片贴上标签,如果你有视觉障碍,我们的技术可以帮助你阅读图片中的内容。我们使用神经网络帮助整理新闻推送的内容:在数千条信息中寻找你可能阅读的几十条并呈送给你。我们使用这项技术处理垃圾信息,如果有人试图在 Facebook 上分享不该有的东西,我们可以很快检测并删除它。

New Scientist:你曾说过虚拟现实设备将改变未来人类的交际方式,Facebook 的人工智能技术会对它有帮助吗?

Schroepfer:人工智能是 VR 中的一项关键技术。在现实世界中找到你的头和手所在的位置,然后映射到虚拟现实的世界中,这是一个计算机视觉和虚拟现实上要解决的技术问题。不解决这个,VR 系统就无法运行。在还没有这种技术的一二十年前,你就做不到这些。

还要思考一个更深的问题,如何将现实的化身带入虚拟现实的世界。如果和我同处在虚拟世界的人笑了,我就能感觉到他的虚拟化身的笑,并且还能确保这个化身笑的像他一样。当这个人说话的时候,我们实际上在分析音素,也会模拟其虚拟化身的嘴型,所以它们看起来很像真的,就像真人在说话。如果这个化身一直像块石头一样,你就不会感觉到那个人的存在。

长期来看,思考一下现在正在搭建智能代理的所有这些系统,无论是即时讯息机器人还是家用机器人。VR 是一个非常自然的环境,因为在这个环境中有些东西能帮你在虚拟世界中定位。你可以说,「嗨,带我去火星,」或者「带我去看我的朋友 Joe,」然后这个虚拟代理就会帮你导航而不是点击菜单或移动周边的按钮。这是一个自然的虚拟助手世界,可能还要很长一段时间才能实现。

New Scientist:开发它需要什么?

Schroepfer:我认为语音识别在人工智能领域是一个容易解决的问题,现在的一些系统已经做得非常好了,但人工智能面临的最大的挑战也在这个领域:如何理解人们话中的含义。当我说「带我去火星(Take me to Mars)。」那到底是什么意思?它是一个游戏?是《火星救援》的预告片?我在暗示什么?这是人工智能面临的挑战。

当这些系统工作良好,可以解决人们所需,它们看起来简直是神奇。但如果机器给你了错误的答案,事情就变得令人沮丧了。如果你必须建立一个完美的系统,否则没人会使用它。这是人工智能面临的一个问题:如何建立一个系统,理解人类的自然语言。

New Scientist:你觉得当所有人的手机里都有神经网络以后世界会变成什么样子?

Schroepfer:时间是生命中不能承受之轻,我觉得人工智能可以帮助我们更好地利用我们的时间。如果我需要学会三种语言才能和所有家人们交流,假如有一个系统可以自动帮我翻译,我用于学外语的时间就可以用来陪家人了,人工智能帮助我们省下来的时间可以用来创作音乐,做额外的工作,做任何事。

我的希望是:人类在未来不用浪费任何时间,我们的系统会协助我们做那些琐碎的事,而我们只需关注最重要的。

理论Facebook专访产业终端智能手机Mike Schroepfer神经网络