深度专访:Maluuba如何迅速成为最受关注的NLP公司?

2016 年 6 月,人工智能创业公司 Maluuba 公司发表了一篇关于机器理解的论文(http://arxiv.org/pdf/1606.02270v1.pdf),提出了目前最先进的机器阅读理解系统 EpiReader ,该模型在 CNN 和童书测试(CBT)两个数据集上的成绩都超过了谷歌 DeepMind 、Facebook 和 IBM 。深度学习元老 Yoshua Bengio 也是这家创业公司的顾问。上月,机器之心对该公司进行了专访。


受访者:

  • Adam Trischler,研究科学家、机器阅读理解(MRC)团队负责人。

  • Eric Yuan, MRC 团队研究工程师。

  • Mohamed Musbah,公司产品副总裁 。


加拿大滑铁卢大学(University of Waterloo)以计算机学科闻名,2011 年 8 月 18 日,学校在读研究生 Kaheer Suleman 发明了一款智能程序,取名 Maluuba 。同年,他与几位同学创立了 Maluuba 公司,他们最初的想法是做一款智能语音旅行工具,用户可以通过语音搜寻航班。

2012 年 2 月,Maluuba 从三星风投获得 200 万美元种子轮投资。半年后,他们的第一款产品出现在公众视野中,这款程序能把用户的语音请求转化为有用的信息或行动。虽然不少媒体将之称为「Android 平台的 Siri 」,但 Maluuba 的初衷却是要挑战 Siri ,而后续发展也表明,Maluuba 的确比 Siri 更出色。


Maluuba 通过绑定第三方服务来实现语音助手功能。2012 年 11 月,公司对外发布了自然语音处理 API 接口,移动开发者可以在自己的应用中添加类似 Siri 的语音处理功能。2012 年 12 月份推出了语音购物功能,用户可以通过语音进行购物。在语音助手领域,Maluuba 的步伐比较快。


2013 年,随着越来越多消费类电子产品公司和设备制造商乐于将一些新技术融入自己产品,Maluuba 也加快了与智能手机、电视、自动驾驶汽车等公司的合作。比如, LG 旗舰 G 系列手机的 voicemate 应用就采用了 Maluuba 的技术。2013 年 2 月,Maluuba 正式宣布向 Windows Phone 平台迁移。Maluuba 的 Windows Phone 8 版本拥有 Android 版本的大部分功能,例如可以搜索餐馆、影院、新闻和企业(以及进行语音购物)、设置闹钟、提醒和会议安排、打电话、发短信和邮件、指示方向和天气,甚至还集成了 Outlook 日历。


Maluuba 最初愿景是想让机器拥有人类水平的理解力。人工智能面临的重大挑战之一就是那些缺乏大规模标记数据集的领域,或者难以对相关环境进行较好模拟的领域。语言就是一个很好例子。互联网上包含有无穷无尽的网页,但上面全都是文字,没有一个地方找得到以机器能够理解的形式所书写的关于这些文字意思的内容。因此,机器学会阅读将是人工智能在处理和理解人类语言进程中一个里程碑式事件,也是一个真正人工智能必须达到的标准。


不过,Maluuba 成立之初就认识到,深度强化学习的基础研究和技术成熟尚需时日。2014 年,时机趋于成熟。标志性事件就是 DeepMind 采用了深度学习技术的通用人工智能在无需监督的情况下,就可以掌握多种电子游戏。


2015 年 8 月,Maluuba 融资 900 万加元(A 轮)用于进一步推进深度学习研究。同年12 月,Maluuba 在深度学习重镇——加拿大蒙特利尔开设了一个新的研发实验室(有 13 名深度学习研究人员,负责人是公司 CTO Kaheer Suleman )。Maluuba 关注机器学习中的两个细分研究领域:对话和机器理解。同时,像 Maluuba 也更关心研发解决通用问题的人工智能,对解决真实世界问题更感兴趣。他们相信自己能找出更好的人机交互方式,并与蒙特利尔大学教授、人工智能专家 Yoshua Bengio 和阿尔伯塔大学教授、强化学习专家 Richard Sutton 等展开合作。


image (1).png

Yoshua Bengio

Sutton-head5.jpg

Richard Sutton


值得注意的是,此时全世界已经有超过 5000 万台移动设备(比如,智能手机、自动驾驶汽车等)采用了 Maluuba 的自然语言处理服务。


2016 年 3 月,Maluuba 登上新闻头条。研究人员发布论文(http://arxiv.org/abs/1603.08884v1),介绍了他们最新的进展。论文描述了一个能够阅读几百个童话故事的算法。训练结束后,该算法可以正确地回答算法并不熟悉文本的多选题,准确率超过 70% 。研究人员还在《哈利波特和魔法石》上进行测试,该算法能够以近似的准确率回答相关文本问题。这一成绩,比使用深度学习方法前提高 15% 。也比最好的人工编码解决方案好 2% 。Yoshua Bengio 说,「从数字上看,这是一次大的飞跃。」


Maluuba 认为,通过理解故事角色在时间和空间中的位置和追踪故事情节,他们能够将这种「思考」转变成一个理解用户需求、更加有效的虚拟个人助理。这有点类似 Facebook 团队用《指环王》的简化版故事开展的研究。 然而,Maluuba 强调说,他们所使用的故事更长,而且是由人写出来的( Facebook 使用的故事是由机器简化过的)。通过阅读人类撰写的文字,算法能更好的理解人类交流和沟通的方式。


4 月, Maluuba 将一段技术演示视频放上了 Youtube ,视频中的人工智能机器人 Marcy 在阅读了第五季《权利的游戏》梗概后,马上领会了故事的复杂情节。好比对这部美剧一无所知的普通人在简单阅读维基百科剧情介绍后,立刻弄懂了整个故事。


技术演示表明,Maluuba 已经可以处理大批量的文字数据,并且能回答更加复杂困难的开放性问题。在机器学习和人工智能领域,这是一个巨大的突破。Maluuba 的产品副总裁 Mohamed Musbah 表示:「人们在未来的几个月中会看到一些非常有趣的事情。」


2016 年 6 月 30 日,Maluuba 发表论文 A Sequence-to-Sequence Modelfor User Simulation in Spoken Dialogue Systems,介绍了一种基于一种编码器—解码器循环神经网络的数据驱动的用户模拟器。


如今的 Maluuba 已经成为自然语言处理领域的领跑者,以下是机器之心的采访实录。

一、技术和研发

公司研究科学家,机器阅读理解团队负责人 Adam Trischler

xwvvogz2x4al8gmraiyb.jpg

机器阅读团队的研究工程师 


Eric Yuan(左)机器之心:你们 6 月份那篇重要的论文里提到 EpiReader 框架,你能为读者简要解释一下这个框架吗?特别是其中两个的神经网络。

Maluuba:EpiReader 采取两个步骤来确定问题答案。第一步(Extractor), 我们使用了一个双向 GPU 逐字阅读故事和问题,接着采用一种类似 Pointer Network 中的 Attention 机制在故事中挑选出可能作为答案备选的单词。第二步( Reasoner ),这些备选答案被插入「完型填空」式的问题中,构成一些「假设」,接着卷积神经网络会将每个假设与故事中的每个句子加以比较,寻找文本蕴涵( Textual Entailment )关系。简单来说, 蕴涵是指,两个陈述具有很强的相关性。因此,最近似故事假设的蕴涵得分最高。最后,将蕴涵得分与第一步得到的分数相结合,给出每一个备选答案正确的概率。


机器之心:在非结构化数据方面,EpiReader 取得了很多进展。这是否意味着制造能够理解知识、进行推理机器的步伐加快了?距离自主知识学习(automating knowledge learning)更近了?

Maluuba:我认为,在这个领域还有很多工作要做,但是我们也前所未有地靠近这一目标。无论是我们还是这个领域的其他学术机构曾经做的研究,大致都发生在过去几年当中,几年后,需要做更多的研究才能更加推进研究,我们也在推进这方面。


我们这个公司也将技术用于产业,目标也是给研究以反馈,看看还存在哪些巨大挑战,如何推进这些问题的解决。因此,问题在于你能多快地前进?这里的挑战是更加基础性的,我相信你们也了解这一点,需要进行很多无监督学习的研究工作,不需要人为参与就能从信息中学习。这是一个仍然需要进行许多研发工作的领域,也是一个非常令人兴奋的领域,因为这一领域的推进能让我们更加接近真的智能。


就过去一年里所发生的事情而言,我们当然持乐观态度。但是,我认为我们应该谨慎,不要对自己取得的成就太过兴奋。过去一年中,我们已经做了很多工作,在接下来三年中,我们必须继续将其作为一个产业来做。


机器之心:论文没有讨论误差分析(error analysis),你可以为我们的读者解释一下这个项目是如何进行误差分析的吗?

Maluuba:斯坦福大学近期一篇论文《A ThoroughExamination of the CNN/Daily Mail Reading Comprehension Task》就是根据问题类型和难度,对 CNN 数据集进行了分析。我们也正在用这些问题子集测试我们的模型,从而更好地理解模型的误差模式(error mode)。

机器之心:在 Reasoner 部分,对假设向量(hypothesisembedding)和句向量(sentence embedding)进行结合时,你们直接将 similarity 和两个 embedding 进行连接,然后放进 GRU 。你们考虑过将这一组合送入一个更深层的结构中吗?比如将两个嵌入输进一个多层 DNN/RNN ?

Maluuba:目前我们确实正在考虑用更有趣、更深层的方法来比较假设向量和句子向量。


机器之心:EpiReader 的表现比谷歌 DeepMind 、Facebook 以及其他行业领先者的解决方案还要好,这一点你们已经证明了。那这对你们来说意味着什么?

Maluuba:这意味着 Maluuba 在通往世界最先进的关注自然语言处理的人工智能实验室的道路上,迈出了重要一步。我们的研究结果证实了自己是这个领域的重要贡献者,我们有能力设计出既富创造性又高效的解决方案,解决自然语言理解中的某些重大问题。我们也很兴奋推进了自然语言研究边界。


在让人工智能更加贴近现实的过程中,创业公司可以扮演什么样的角色,我们的进步给出了确证。尽管我们也看到了人工智能其他领域(比如语音识别等)进展巨大,但是,在机器学会像人类那样理解(和阅读)之前,还有很长的路要走。我们会继续前进,为语言理解研究带来突破,并在这一过程中,逐步将技术推向应用市场。


机器之心:如何确保训练集的质量?除了来自学界的数据,你们也会付费让别人提供有质量的训练集吗?

Maluuba:我不能论及如何创造你自己的数据集,建造你自己的数据集的方法各不相同,但是,这肯定也是一个重要的领域。数据集,正如你能想象的,对推进研究的成功,极度重要。很多取决于现有的研究以及我们是否尽其所能,这也是我们选择 CNN、 CBT 数据集的原因,他们可能是比较极致的。我认为是那个领域最新近,最被认可的数据。但是,为了前进,你要在这方面绝对正确,需要你在发展和分析该领域数据集方面,成为先锋。那也会是一个与不同机构合作的领域。


机器之心:在自然语言处理领域,绝大多数框架都是采用 Seq2Seq 模型加 Attention 机制,这种框架也存在一些问题。有没有其他改善的方法?

Maluuba:在自然语言处理任务中,Seq2Seq 的框架已经变得很常见了,特别是在机器翻译领域,已经被证实是非常有效的方法。然而,根据我们的经验,Seq2Seq 模型并不是最适合问答任务的,而我们设计 EpiReader 就是用来解决该任务的。问答任务需要更高层次的推理能力,Seq2Seq 模型框架并不具备这种能力。而且,带有 Attention 机制的 Seq2Seq 模型在会在 hidden states 里对单个单词的表述进行某种混合(这会对基于 Pointer Network 模型的答案选取过程带来麻烦,因为每个词的截然不同的意义被模糊掉了)。


值得一提的是,带有 Attention 机制的 Seq2Seq 模型更加适合这样的任务:输入序列与输出序列密切对应 (这就是机器翻译中出现的情况,但在问答领域,并不尽然)。


在另一篇近期论文中,Maluuba 提出了一种 IterativeAlternating Attention (IAA) 机制,它在问答任务上也表现的非常好。这一机制会多次阅读问题和故事,关注不同部分,随着时间的推移建立起一种信息状态。通过这种方式,IAA 机制模拟了一种链式的推理过程。有关细节可参考论文 IterativeAlternating Neural Attention for Machine Reading


机器之心:当涉及对话时,传统的自然语言处理方法无法真正解决一些认知计算难题。为了研发可与人类进行自然交流的智能聊天机器人,除了自然语言处理,是否还需要其他技术?

Maluuba:就对话系统而言,我确实认为这不仅仅是个理解系统问题。如何拥有一些更加基本的智能,比如、推理,理解,分析等,其中涉及的有很多事情都超越了自然语言处理的范围。


我们正在朝着那个方向推进,比如,EpiReader,就是专注机器理解的,但是,背后的想法是教会机器基于信息进行推理。未来我们想做的事情是让聊天机器人理解情感(emotion),回答问题之前人类身上所发生的一切,它们甚至需要感知能力,比如视觉甚至听觉以及其他我们需要的,所有这些加在一起,就是每个人试图触及的圣杯:人工智能。自然语言理解只是蛋糕的一部分,我们认为还有许多其他不同领域,但是,过去十二个月中,这一领域的进展并不多,我们之所以决定在这里加倍下注,是因为还有很多要做的事情。

二、业务和产品

产品副总裁 Mohamed Musbah


机器之心:刚才提到了一些论文中的前瞻性技术,你们是在研发使用了这些技术的产品吗?你们最感兴趣的领域是?

Maluuba:我们对产业中的应用非常感兴趣。其中,我们非常关注用户服务这一领域。因为它涉及大量与真人交互的场景,并且需要考虑用户体验。在真实的场景中,当用户向公司报告错误信息的时候,他们希望自己的问题能够尽快得到解决。用户服务本质上是两个人之间的交流,现在的问题是,我们要如何从机器的角度,使其尽可能地自动化和稳定,并解决用户的问题以提升用户体验。机器是否能够与人类对话?


我们最新的一篇论文即是关于「机器理解(machine comprehension)」的,在论文中,我们将数据传送给人工智能模型,来测试模型能否理解其中的语义。目前我们还在持续研究,并将在几个月后发布更详尽的论文。其中,我们非常感兴趣的领域是 conversational agent 以及对话系统。


机器之心:在产品层面,你们是希望借助这些技术研发出带有 API 的服务平台,还是一些专门的产品或解决方案?

Maluuba:我们对此也非常感兴趣。我们的 Research Lab 做了许多非常有意思的工作。但是,他们更多是研究方向的内容,如果要成为商业产品,还需要很多工作。同时,对于产业来说,这还是一个比较新的概念。但我们也在努力开发其他应用,例如对话系统——我们致力于开发能够与用户进行完整对话的系统。同时,我们也正在扩展已有的 API ,增加其功能,这也是未来我们努力的方向,最终我们想要实现的就是我之前提到的——「机器理解」。


一个应用的例子是阅读汽车使用说明。一辆车的使用说明往往有 200 页之多,一般没人能看完。我们希望实现的是,将手册内容输入到神经网络系统中,系统就能帮你理解其中的内容。这牵涉到自然语言处理的问题,也是「机器理解」能够实现的关键。最终,我们想要的呈现方式就是 API :我们提供用户端接口,用户提供文本,最终我们将分析结果返回。此外,我们还提供线下模型,以应对无法使用网络的情况。


机器之心:阅读手册 v.s. IBM 阅读医学书籍。Maluuba 想做的是什么?

Maluuba:当然。我不能为某个公司代言说他们的目标如何,不过,我可以肯定地谈论这个产业即将出现的一般趋势,以及我们如何保持自己的独到之处。我在这个领域见证的事情之一就是,机器学习,甚至自然语言处理,几乎所有现有工作都是朝向一个非常具体的狭窄领域发展,都被用来解决某个领域的某个问题。这是种非常狭窄的做法。


但我们认为,未来不会是朝着这样的方向发展。如果我们看到某个人工智能系统朝着某个领域行进,它只能解决那个领域的问题,没办法应用到其他领域,那它们都不具备一个人类儿童的能力。而我们正在尝试的是,在这方面走出与众不同的几步,我们不是教机器完成一些狭窄领域的工作,我们是教机器更多地理解人类。真正有意义的是给予机器基本认知能力。也就是说,赋予机器一些人类通用的能力,也就是理解。比如,当我读一篇文章,无论主题如何,无论是虚构小说,杂志或医学期刊,你能对这些领域有着基本理解能力,这就是人类,机器可不行。


问题就是,当希望机器近似人类认知系统,那么,我们不得不给予机器基本推理能力,我们试图表明,本质上,我们不仅没有打造极度狭窄的领域,而是给予机器一个普遍理解能力,可以应用于任何领域。我们发布的那篇 EpiReader 文章是这一系列(自然语言理解)研究文章中最新的一篇,我们在文中用 CBT 和 CNN 数据集验证了(自然语言理解能力)的精确度。目前的情况是,我们是否能教会机器拥有简单基本的理解能力,并将其运用到不同领域,这些领域仅需最少的人类参与。因此,我们是否能教会机器像个十岁孩子一样阅读医学期刊,或者《哈利·波特》?它可能并不一定发展出某种专长——十岁男孩可读不懂医学期刊,但是,十岁孩子能够理解内容的基本面。


机器之心:因此,你们的产品不会限定在特定领域,会被广泛用于许多领域,无论是技术支持或者医疗助理,你们都会运用到,对吗?

Maluuba:当然。作为公司,我们不可能涉足每个垂直领域,我们可以打造一个非常泛化的系统适用于几乎所有垂直领域。这里的目标是跨越由于某个领域知识缺乏所导致的局限,为了跨越局限,系统必须具备基本理解能力,这也确实是一个挑战,我们能否教会机器像人类一样推理,教会机器学会推理、记忆、理解以及对话,这些都离不开自然语言理解背景。


RedWhittaker.jpg

三、公司发展和未来

机器之心:能否简单介绍一下,Maluuba 是如何发展到今天的 ?

Maluuba:最开始,大约 2010 - 2011 年左右,我们几个计算机专业学生,在滑铁卢大学创立了人工智能实验室。我们最初的目标很简单 —— 创造能够与人类交流的机器。虽然近几年人工智能和自然语言处理的发展如火如荼,但在五年前,这确实是一个非常「疯狂」的想法。但是,就是这一愿景诞生了这个团队。现在,我们很幸运地能够与许多公司展开合作,用我们的产品作为后端支持,使得他们的机器能够与用户进行对话和交流。


机器之心:能否讲一下 Maluuba 发展过程中的具体故事,比如成功解决某个特定领域问题,就像发表论文中的那样。

Maluuba:过去,我们推出过成功的技术,驱动跨设备的语音体验,目标在于将自然语言理解推进某个领域。现在公司正在尝试做的许多事情就是如何将智能对话系统用于公司结构,之前提及过客户服务,这也是我们目前重点从事的领域,将许多自然语言理解技术注入这方面,因为这里涉及许多对话。


我肯定有很多进展和故事可以分享,不过不在其位,不谋其政,对此,我只能表示道歉。


但是,我认为,距离人类一样的对话还很遥远,因为,人类对话通常难以预测,可以往各个方向展开。当谈到代理和机器,人们总是兴趣盎然,但是,教会机器理解人类的行为细微差别,太难了,这个领域的一些研究,比如被人们认为人工智能下一个里程碑的研究:教人工智能在星际游戏中击败人类对手,就很难。因为在行为方式以及欺骗机器方面,人类实在太有创造性了,做到这一点就要理解人类非常细微行为差别,教机器学会这一点,太难了。将来,我们可能会发表一些有趣的研究结果。


机器之心:你们现在拥有多大规模的团队?

Maluuba:给不了一个确切的数字。我们的目标之一就是解决语言处理上的基础问题,你需要一个团队来解决这些问题,唯一的解决之道就是建立一支真正强大的团队。很幸运,我们在蒙特利尔的研究办公室完成了这些工作,绝大多数进展都来自那里。


我们的目标就是建立世界最大的深度思维自然语言试验室(deep thinking naturallanguage lab)。这个领域非常特殊,尤其是当下。我们想见到这个领域中更多的人才。到目前为止,我无法给你一个确切的数字,但是,我们很自豪现有团队规模,也希望团队进一步壮大。就打造世界最大的自然语言处理器而言,我们正逐步走上正轨。


Maluuba 团队在讨论代码


机器之心:你们有三位很优秀的顾问。你们是如何与这些顾问,比如 Yoshua Bengio 建立起联系的?这些顾问如何帮助公司?你们如何评价这些导师在这一领域中的研究工作?

Maluuba:我非常高兴我们能有这些优秀的顾问,Bengio 博士在人工智能领域一直都非常有名气。关于人工智能的发展,我们的共识是,自然语言处理(NLP)将会是非常关键的领域。现在的人工智能能够驾驶汽车,但是在理解人类语言、进行语义推理等方面还十分局限。我与 Bengio 博士之前一直在探讨的问题就是,怎样才能推进自然语言处理的发展?随着讨论的深入,Bengio 博士成为了我们团队的一员,大家群策群力解决领域中的各种问题。更凑巧的是,Bengio博士正在研究的许多问题,也是我们此前一直试图解决的问题。


机器之心:你们的顾问之一 Richard Sutton ,他是强化学习领域的领导人物和权威,不过到目前为止,你们发表的文章没有涉及这方面的内容,你们是否在积极开展强化学习方面的研究,而且会在近期发表这方面的研究?

Maluuba:当然。随着研究的推进,我们会让机器理解很多信息,也会继续这么做,但是,我们会在强化学习和对话系统方面发表更多的论文。


机器之心:你们已经遇到的最大的挑战是什么?技术的还是非技术的?走到今天,你们克服的最大困难是什么?

Maluuba:在过去八到十个月里,我们做了很多研究工作,而且我们也很幸运,有了 EpiReader ,我们可以击败该领域目前最好的结果(来自谷歌、Facebook 以及 IBM )。


现在,这是一个处于初期阶段的领域,从发展的眼光看,是一个非常新的领域,这也意味着并非条条大路通罗马。就我们现在所取得的成就来说,我们是幸运的,而且我们还有很多进展中的研究,接下来六个月,我们会宣布这些消息。


但是,无论对我们还是对这个领域的其他人来说,这完全是一个未知领域。我们可以解决前所未见的挑战。从技术上说,教机器理解如何进行推理,在 2010 年看来,这很疯狂,2016 年看来,仍旧疯狂。但是,这并不那么疯狂,这是我们正在尝试的基本工作,我是说,我们是不是能教机器如何推理,帮助人类。现在,为了实现这一点,困难很大,但是,我们已经有了 20% 或者 30% 的进展,做了很多事情。这个领域有着无限可能,仍处在非常非常初期的阶段,但是,我们很兴奋自己目前所取得的成就,而且我们相信还有很多要做的事情。


机器之心:我们如何计划与其他拥有更多资源的大公司竞争,比如,谷歌、Facebook 等?

Maluuba:好问题。这是任何一个创业公司都会面临的挑战。大型公司总是有更多资源。像是谷歌这样的大公司或许有一天会给我们研究团队中的任何人打电话说「噢,我给你一百万美元,加入我们吧」(大笑),这是实际问题,也是我们必须解决的问题,我的答案包括几个方面:

首先是激情。当我们引进团队时,会生动描述我们要做的事情,以及如何解决这些问题。如果你从研究的角度观察一下更大的公司。不同之处在于,他们不只是学术性的,比如产业环境,结构设置(setup)方面。


其次就是 vision ,我们目前的目标是如何让每一个研究人员在实现这个 vision 的过程中发挥出重要作用,我们可以让他们加入公司。这与创业公司如何与大公司竞争无关,实质上是个基本层面的问题:每个研究人员想要做什么。比如,研究人员想要丰厚的报酬以及很惊人的工作量?这或许不适合我们;还是想要解决基本问题?我们正在寻找的是与我们的目标相一致的人才。我们会证明,这份工作值得做。我们也认为,我们可以在一个简单的公司中设法做到这些,然后继续成长。很幸运,我们可以有如此长足的发展,也期待更大的发展。


Maluuba 位于安大略省滑铁卢的总部


机器之心:你们将继续维持加拿大创业公司的本质?打算将实验室扩展到世界其他地区吗?未来计划如何?

Maluuba:我们当然想要那样做。这是一个全球化的世界。事实上,我们也是这么对话的:我们这里现在是早上十点,而你们那边是晚上九点。感谢你抽出时间与我们进行访谈。这就是全球化的方式,也是我们喜欢去做的事情。我们选择今天所在的位置,并非意味着我们不会去世界各地参加会议,不去与那些聪明的人会面,不期待与他们合作。我当然期待!比如,我们看到中国发生的一切那么不可思议。我们已经全球化了,也在和全球公司合作,包括中国,那里有一些不可思议的公司做着很棒的工作,让他们在这个领域里强大起来,我们现在没有去探索如何扩大我们的研究,但是,这是一个阶段性目标。


机器之心:「我们的愿景是建立这样一个世界:智能机器与人类携手推进人类物种的集体智慧。」公司的愿景非常激动人心,能更详细地描述一下?或者给些例子?

Maluuba:我们对人工智能与人类的未来非常乐观。在过去几十年间,人工智能主要被用于完成操作性任务。所以现在的问题在于,我们还能赋予机器多大的智能?机器变得越智能,它们对人类来说就越可靠。自动驾驶汽车就是一个很生动的例子。曾经人们感觉它还很遥远,而现在我们已经几乎要实现了。


除此之外,机器人领域也取得了非常激动人心的发展。现在的机器人已经能够初步执行动作类任务,这能将人类从日常的琐碎任务中解放出来。例如,为了喝一杯咖啡,你需要对咖啡机进行各种操作,而如果我们赋予咖啡机智能,让它能够了解你对咖啡的喜好,准时帮你制作咖啡,一切都将变得更加简单。这听起来挺疯狂,但我认为我们确实正在朝这个方向发展,机器确实在变得越来越智能,它们将能够帮助人类完成日常工作,从而让我们的生活更便利。


机器之心:对其他人工智能创业者和研究人员,有哪些方面的建议?

Maluuba:人工智能方面。我想说,此时创业正当时,也很让人兴奋, 因为这里需要解决很多令人激动的问题,这个行业已经到了这样一个阶段:我们正处在解决这些问题的前沿,而且公司非常高兴支持真正的创业者来解决这些问题,无论是资金上还是策略能力上。现在成为这个领域的创业者,很让人激动。


但是,我想提醒需要注意的几点。


首先,区分事实和虚构。很多人工智能领域里的信息都过分夸张了,因为对现状缺乏基本了解,而且对人工智能持过于兴奋态度也源于人类本性。区分事实和虚构能帮助你真正理解自己所处的位置,帮助你准确定位所要解决的问题。


第二点就是挑选别人没有解决过的独特问题,然后试着如何用人工智能加以解决,看看自己解决的情况如何,和别人有什么不同。我认为几年后,这个领域的公司就要比拼:看谁能利用最先进的技术做出没有人想到新产品,解决别人没有解决的问题。

入门创业公司产业NLP机器阅读理解