Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

机器之心专访:论文上Nature封面之后的研究进展

记者/赵云峰

2016年4月的《Nature》封面文章《Semantic information in natural narrative speech is represented in complex maps that tile human cerebral cortex》中,加州伯克利大学的  Jack Gallant 和他的团队(Gallant 认知、计算和系统神经科学实验室)终于成功绘制出大脑语义地图(985 个英语常用词汇语义)。我们可以清楚看到大脑如何根据更深一层的词汇含义,将词汇安置到诸如数字、地点或其他基于共通主题的子类别当中。

2016年5月26日(当地时间),脑科学领域的顶级峰会 Brain Forum 2016 在瑞士洛桑的瑞士科技会议中心举行,脑科学领域的世界级专家、研究者、工程师、医疗健康专家、创业企业家、产业专家和投资人集聚一堂,共同探讨如何将脑科学转变成触手可及的解决方案。

机器之心是唯一一家获邀参会报道的中国媒体。会议期间,机器之心记者赵云峰专程采访了也来参加这次峰会的 Jack Gallant 教授。

采访开始

机器之心:在发表了论文《Semantic information in natural narrative speech is represented in complex maps that tile human cerebral cortex》之后,您的团队开始探索新的地图(atlas),大脑如何保存语言其他方面的信息,比如句法(syntax),目前在这些方面上有什么新进展?

Jack Gallant:用 Moth 的故事( The Moth Radio Hour,也就是 Nature 封面研究中使用的故事——编辑)做完上次研究后,我们给所有其他水平的信号进行了建模,包括音素(phonemes)、词素(morphemes)、句法(syntax)、语义等。我们没有做叙述,因为给叙述建模过于争议,目前还没有统一标准。

语义目前是探讨的最广泛的话题,最容易发表这方面的文章,所以我们将这方面的论文发表了。这周我们还会发出另一篇论文,主要关于句法、音素等。结果要几个月后。这项研究和之前的研究是一回事,只不过针对的是不同信号特征。

处理这些对象的难点在于,它们发生时间都是很短的,而功能性磁共振成像更善于记录发生速度慢的信息,对于快速发生的事件效果很差。因此,尽管我们能够选择其它特征来进行建模,但是它们并不都是效果最好的。

机器之心:你们绘制完成的地图,让我们看到大脑不同区域如何表征 958 个常见英语词汇意义...

Jack Gallant:  我们选取了英文中最常用的 985 个单词,并尝试在一个含有 60 亿单词之多的语料库中,寻找它们之间的关系。这个过程与语义分析很像,是一个共向变量空间。    所以这些特性是词义上(meaning)的特性,它更像是词义连成的关系网,其中每一个词义都能够通过其与附近词义的关系推导得出。

机器之心:下一个研究目标是什么?

Jack Gallant:我们近期快要完成的是一项比较听力与阅读过程的实验,例如,同样一个故事,你可以通过阅读文字和图片的形式了解,也可以通过听音频的方式。但是,二者的语义地图几乎是一样的。另一个我们感兴趣的主题是双语现象(bilingualism)。拿汉语和英语举例,我们的语义空间是一样的吗?我们的语言空间自然是完全不同的,所以我对汉语的语义一无所知。在双语研究上,最有趣的组合可能是汉语与任意一种欧洲语言,因为它们在语言学中属于两种完全不同的分支,许多意群的发展形式也是完全不同的。目前我们主要重心在英语和汉语上,未来也可能比较英语和西班牙语,等等。

机器之心:你认为你们的研究成果会给人工智能领域一些灵感,让机器学习表现更好吗?

Jack Gallant:谷歌翻译很赞!在实验室我们大量地使用人工智能应用,如获得事物特征等。我们会将自然语言处理应用到故事上。例如,当你玩电脑游戏的时候,游戏中的所有你能看见的、你的目标等等信息,都一定能够在你的大脑中被表现,但是我们怎样才能知道这些特征是什么?

有一种你能想象的方法是,我们干脆让一个人工智能来玩这个游戏,然后让其内部显现的特征带入到大脑中。因此,我同时也感到,因为我们对大脑的认知如此有限,所以其实很多时候我们是将人工智能上的信息应用到大脑上,而不是将大脑上的内容转移到人工智能上。

另外,有一点我认为值得讨论的是,近期大热的神经网络其实也只是受人类大脑的启发而已,而并非高度的模仿。因为在大脑中的神经网络里,信息是双向流动的,前馈与反馈是并存的,如果你完全关闭了反馈的通道,整个系统就会崩溃。然而在计算机领域的神经网络中,信息是单向流动的,也就是只有正馈。因此,我相信,这种含有正反馈的动态的神经回路机制会在计算机领域变得十分重要。

机器之心:你的研究很棒,看起来就像一个平台,未来这个平台会向其他人,比如科学家、研究人员开放吗?

Jack Gallant:会的。我们希望人们了解我们在做什么。SPM 是一种进行功能制图的传统工具,在使用 SPM 的时候,你必须先获得平滑数据。但是将数据平滑化的原因不是因为这样对数据好,而是因为这样使得统计参数图在统计意义上更具有合理性。这种做法事实上对研究是有害的,因为在这一过程中,为了使统计方法运作良好,你事实上丢失了很多信息。而在我们的框架中,你不需要平滑数据,除非你必须这么做。我们希望更多人能有机会使用这一平台,但我们可能不会自己提供软件上的支持。目前,我们会一点点地开放。但是像 Brain Viewer 这样的工具已经是完全开放的了,任何人都可以在上面对大脑结构进行剖析和观察。你可以直接到 GitHub 下载。

在学校内部,我们也将我们的软件开放给伯克利的情绪研究室的研究人员们,他们能够使用我们的软件和系统完成自己的实验。此外,我们也正在和加州理工的实验室进行合作。

机器之心:您这项研究的最终目标是什么?您希望能在多大程度上了解大脑理解语言的方式?

Jack Gallant:语言只是作为人类的一个组成部分,当我们在做功能性磁共振成像语言实验的时候,我们不是在理解语言,而是试图理解大脑是如何理解语言的。我认为这二者是不同的,所以我更关注的是研究大脑是如何理解语言的。所以我们努力在做的唯一一件事情是,将大脑所有区域中的所有信息还原出来。假设有 500 个在运作的大脑区域,其中每一个区域代表 15 个维度(dimensions),那么现在我们就很清楚有 7,500 个维度是我们需要还原的,那么我们就有了大脑中全部 7,500 个维度的信息。而这些只是名义上在不同大脑空间中被转译的信息,其中还有很多子空间,我们现在在座的就是尽可能多地将这些信息还原。

机器之心:假如我们完全了解了大脑对语言的理解机制,未来我们是否有可能实现无需对话,而直接在人脑间进行交流?

Jack Gallant:这个问题很有意思,我想这最终是可能会发生的。但是,现在我们还有很长的路要走。可能很多人小的时候都有这样的经历:你将收音机拆开试图了解它的工作原理,然后你发现其中一个回路是调节音量大小的——可能电压越大音量越大。下一次,当你觉得音量太小的时候,你会尝试增加电压,而这可能导致整个收音机直接报废了。理解一样东西总是比修改一样东西要容易得多,大脑也是这样。即使我们能够很好地掌握大脑理解语言的机制,但如果真要实现大脑间直接的交流,我们需要在大脑中植入外部工具,甚至是改变大脑的结构,而一点点细微的差错或噪音就可能产生难以预料的后果,所以我想实现这一点,我们还需要很长一段时间。

采访结束

Jack Gallant:你竟然穿着我们死对头(斯坦福)的T恤采访我。(玩笑)

机器之心:Go bears!

理论Nature自然语言理解脑科学专访产业
暂无评论
暂无评论~