最神秘的人工智能创业公司Vicarious,让机器拥有想象力

创立于 2010 年的人工智能创业公司 Vicarious 在 2013 年宣布破解 CAPTCHA 之后,受到了连线、MIT 科技评论等媒体的广泛关注。而后,Yann Lecun 公开发文称,谨防人工智能炒作,并称其为教科书式的反面范例。他认为,在获得基准普遍接受的顶级成果之前,千万,千万不要不要轻易相信人工智能创业公司的模糊声明。MIT 科技评论近期再次发文报道 Vicarious,表示这家后来一直潜形匿影的公司将于今年晚些时候发布论文和 Demo。(附:Yann Lecun 公开共享的对 Vicarious 的评价。)

如果没有想象,生活将会多无聊啊。事实上,计算机最大的问题可能就是他们没有任何想象力。

正是这一想法促使创始人们成立了 Vicarious,这是一家神秘的人工智能公司,得到了硅谷一些最知名的公司的支持。受到信息流过大脑的方式的启发,Vicarious 正在开发一种处理数据的新方式。公司的高层人员说,这赋予计算机类似想象的东西,他们希望这能帮助机器变得更为智能。

实际上,Vicarious 也把赌注押在了目前热门的人工智能上。一些公司,如谷歌,Facebook,亚马逊和微软通过给庞大的神经网络灌输大量的数据,即深度学习过程,已经在过去几年里取得了惊人的进步。比如,当深度学习系统被足够的例子训练过后,它就能以非常高的精确度,识别出特定的脸或者动物类型。但是,那些神经网络都仅仅是真实大脑内部所发现的(神经结构)的粗略近似。

Vicarious 采用了一种新的神经网络算法,该算法体现了更多生物上的特征。它的一个重要特点是,在学习了一项信息之后,它能够预想这个信息在其它情景中是什么样的——这是一种人造的想象方式。该公司的创始人认为,要使机器表现出更像人类的智慧,我们十分需要从根本上完全不同的设计。以后,计算机将不得不从更少的数据中学习,并能更轻松地识别刺激或者概念。

尽管在早期吸引了大量关注,但是 Vicarious 在过去几年里一直保持低调。但在今年,该公司表示,他们将会公布他们研究的细节,并且承诺会展示一些令人瞠目的 demo,这些 demo 将展示给人们,电脑在拥有了想象后是多么的有用。

Vicarious 公司总部看起来却并不像人工智能革命的中心。该公司的办公室位于从帕洛阿尔托到旧金山湾的一小段车程处(我们被要求不透露其精确位置),该办公室很平常——与一家麦当劳店只有一箭之遥,并且离一家牙医诊所也只有几个台阶之远。然而,公司内部却充满着高科技创业公司的活力气息。当我拜访的时候,十余个工程师都正在努力工作着,其中几个使用的是令人印象深刻的跑步机办公桌。一些工程师的桌子上摆放着微软的 Kinect 3-D传感器,该公司的 33 岁 CEO D. Scott Phoenix 以不无自豪地说:「我们正非常快速的接近我们所期望的计算能力,这种计算能力能够(让我们)在人工智能上做一些有趣的事,」在我进来后不久,他告诉我。「15 年后,最快的计算机每秒处理的操作数,将会比所有人的脑神经操作数还要多。所以我们真的很接近了。」

然而,Vicarious 不仅仅致力于提高更多的计算机能力。Phoenix 说,Vicarious 创造的数学方法将会更加类似人类大脑的信息处理过程。确实,目前应用在人工智能中的神经网络,和真实大脑里的神经元、树突和突触之间的相似度是极其有限的。

Phoenix 说,人工神经网络一个最明显的不足是,信息是单向流动的。「如果你在一个典型的神经网络里看信息流,它是一个前馈结构,」他说。「但是实际上,在大脑中,反馈连接比前馈连接还要多——所以,(目前的方法)丢失了一多半的信息流。」

一个拥有想象力这个十分「人类」的能力的计算机,听起来是十分神秘的。不可否认,光是考虑想象力可能成为人工智能下一重大进步的关键,就已经十分诱人了。

Vicarious 已经证实,他们的方法能够开发一个十分准确的视觉系统,且效果惊人。在 2013 年,这一系统已能够破解 CAPTCHA(用于防止垃圾程序恶意注册账号的验证图片)。就像 Phoenix 解释的那样,嵌入 Vicarious 系统的这一反馈机制能让其在图片失真或者部分模糊的情况下,想象字符可能会是什么样的。

在一块白板上,Phoenix 概括描述了系统核心方法的一些细节。但是更具体的细节依然保密,直到概述这一 CAPTCHA 方法的科学论文在今年晚些时候发表。

原理上,这个视觉系统可用于其他许多实际应用,比如更准确地识别架子上的目标,或者更智能地识别现实世界的场景。公司的创建者们也表示,他们的方法能扩展到其他更为复杂的智能领域,包括语言和逻辑推理。

Phoenix 说,公司可能会在今年晚些时候放出一部有关机器人的 Demo。确实,公司网站的招聘列表中有一些机器人专家的职位。现在的机器人,在挑拣不熟悉的、排列奇怪的、或者部分模糊的目标上表现不好,因为它们难以识别对象到底是什么。「如果你去亚马逊设备那里就能看到,大部分时间工人挑拣目标甚至都不带看的,」他解释说。「使用感官运用模拟器,他们在想象目标在那里,以及想象手指会碰触到目标的那个地方。」

Phoenix 是公司的领导者,其联合创始人,Dileep George,是公司的技术规划者。George 出生于印度,在斯坦福大学获得电子工程博士学位。在博士研究即将结束的时候,他将注意力转到了神经科学上。在 2005 年,他与 Jeff Hawkins 联合创立了 Numenta 公司,后者是 Palm Computing 公司的创立者。但在 2010 年,George 离开了 Numenta,致力于践行关于大脑信息处理背后的数学原理的想法,同年,他与 Phonexi 创立了 Vicarious。 

在我第一次造访的时候,在电梯里偶遇了 George。他是一个谦逊的、说话很静的人,有着浓重的口音。但在极重要的事物上,他也相当的求证。

到目前为止,这一关于未来人工智能的宏伟蓝图已经帮助 Vicarious 获得了令人惊奇的 7200 万美元的融资。其投资者列表看起来也像是科技领域的名人录。早期的资金来自于 Facebook 的前 CTO Dustin Moskovitz,以及 Quora 的联合创始人 Adam D’Angelo。后来的基金来自于 Peter Thiel、Mark Zuckerberg、Jeff Bezos、和 Elon Musk。

很多人非常渴望看到的是,除了打败 CAPTCHAs,Vicarious 还做了什么。「如果他们今年能像我们展示一些新的东西,我会爱上它。」西雅图艾伦人工智能研究所的 CEO Oren Etzioni 表示。相比于谷歌、Facebook 、百度,Vicarious 还未发表任何论文,也未发布研究人员能使用的工具。「(Vicarious的)人们非常棒,(他们研究的)问题也非常棒,」Etzioni 说,「但现在是时候拿些东西出来了。」

对于拿些投资了 Vicarious 的人来说,这家公司的宏伟目标使等待是值得的。一家投资了 Vicarious 的投资公司 Data Collective 的合伙人 Matt Ocko 表示,即使这需要人们等待一段时间,但潜在的回报看起来是如此巨大,令人愿意赌上一把。一个好的机器学习方法,可以应用于所有处理大数据的产业,他说。「Vicarious 的方法,是我目前见过的最可靠的。」

Ocko 还表示,Vicarious 已经证明,他们的研究成果能够被商业化。「我们会十分谨慎地实现这一点,」他说。

试看今年 Vicarious 是否能够借助其论文和 demo,同样激发其他人工智能研究者和技术专家的信心。如果它真的做到了,Vicarious 能够迅速从硅谷最热门的团队之一,发展为其成长最迅猛的企业。

这肯定也是该公司的创始人们希望看到的一件事。

但对于该公司,同样存在质疑和批评的声音,在 2013 年 Vicarious 受到广泛关注之后,Yann Lecun 就公开表示谨防人工智能炒作,认为它是教科书式的反面范例。不知接下来 Vicarious 的论文和 demo 是否能让 LeCun 改变看法。

附:2013年 Yann LeCun 对 Vicarious 的评价:

人工智能创业公司 Vicarious 声称它们的一个系统能解决 CAPTCHA(全自动区分计算机和人类的图灵测试)问题,成功率达到「90%」。

谨防:这是一个人工智能炒作教科书式的反面范例。

炒作对人工智能而言非常的危险。在过去的 50 多年中,炒作四度杀死了人工智能。人工智能炒作必须要被制止。

可能 Vicarious 在自己构造的一些 CAPTCHA 数据集上,准确率能「升到 90%」。但是:

打破 CAPTCHAs 几乎不是一个有趣的任务,除非你是一个垃圾广告者。

在自己编造的数据集上,很容易就能获得成功。其他人也能以同样的方式超过你。

识别图片上的物体,要比打破 CAPTCHAs 难的多。一些深度学习系统已经能够相当精确地做到这一点。谷歌、百度都在开发这样的系统。

对字符串的同步分割、识别几乎不算一个突破。在这里你能看到一个(http://yann.lecun.com/exdb/lenet/index.html)20 多年前的demo。

悲哀的是,这一声明被数个出版物发表,包括 MIT 科技评论、福布斯等。

这里给科学/技术新闻记者提一个建议:千万,千万不要不要轻易相信人工智能创业公司的模糊声明,除非他们的最新成果已获得可靠的行业标准的认可。

这一点在图像、语音识别等领域尤其重要,因为在这两个领域存在非常好的标准。就图像识别而言,一个非常好的标准范例是 ImageNet 大规模视觉识别挑战赛( ImageNet Large Scale Visual Recognition Challenge)。

当一个创业公司声称在一些随机任务中达到「90% 准确率」时,不要认为这就具有新闻价值。如果一家公司还声称「我们正在开发基于人脑计算原则的机器学习软件」或者使用「递归皮层网络(Recursive Cortical Network)」这样华丽的名词时,我们需要抱有更加怀疑的态度。

目前已有一些令人印象深刻的深度学习应用(例如,谷歌、百度、微软、IBM、及其它一些创业公司),但(Vicarious)并不在此列。

谷歌的自动图片标签和百度的图片检索系统,要比这一声明中的系统强大得多。就算只谈字符识别,谷歌的 StreetView 用于识别房屋门牌号的系统,也要比这个更加瞩目。

过去 50 多年,人工智能曾因为炒作四度「死亡」:人们发表宏伟的目标(通常是为了吸引潜在的投资者或资产公司)却无法实现。然后负面影响随之而来。这在神经网络上已经发生过两次:一次在 60 年代末,一次在 90 年代中期。

不要再让其再次发生。谨防炒作。

顺带一提,除了垃圾广告者和计算机安全研究人员,没有人对破解 CAPTCHAs 有兴趣。这也是为什么你找不到关于这一主题太多的计算机视觉论文的原因。这也是为什么即使存在一个标准的数据集,也难以打破记录的原因。


入门人工智能创业公司VicariousYann LeCun产业