斯坦福开发机器学习脑机接口,帮助猴子打出了莎士比亚名句

给一只猴子一台打字机,早晚有一天它能打出莎士比亚全集,这是概率定理中的著名例子。最近猴子们不负所望,终于打出了哈姆雷特的那句家喻户晓的名言「To be or not to be. That is the question」。这是斯坦福神经义肢移动实验室的一项最新研究技术,他们在猴子大脑中控制运动的区域里植入了微型电极阵列,并使用了机器学习算法,开发出一个脑机通信接口。猴子们使用这个接口能在一分钟内打出 12 个单词,这是目前最高记录,而且研究员 Paul Nuyukian 说,这项技术还有很大的提升空间。


Synced (4).jpeg

图像来源:斯坦福大学


「To be or not to be. That is the question.(存在或灭亡,这是一个问题。)」这句话也是猴子 J 使用大脑植入物来控制计算机光标打出来的。


首先说清楚,这只猴子不知道它打出来的是莎士比亚的名句,它对哈姆雷特这句著名的独白也没有什么深刻的理解。猴子 J 和它的伙伴猴子 L 都是经过训练后才能使用它们的神经植入体来移动电脑屏幕上的光标,当屏幕上的圈圈变成绿色时,它们就点击这些圈圈。斯坦福大学的研究员们将这些文字放入那些目标中来模拟打字任务。所以要打出哈姆雷特的这句名言,第一个字母「T」圈圈要被点亮,然后是「O」,以此类推。


为什么要做这些练习?难道这只是让记者抛出「无限猴子定理」的一个借口?


因为我们一直有这样一个看法:根据概率定理,如果你给一只猴子一台打字机和无限的时间,它最终会随机打出莎士比亚的所有作品。


然而这里的情况并不是这样,生物工程师们有一个更加接地气的动机。通过模拟这个打字任务,他们证明了他们的大脑计算机接口可以惠及那些无法正常沟通的人,包括肌萎缩侧索硬化症(ALS)晚期患者,也被称为也被称为 Lou Gehrig 病,这些人最终会全身瘫痪,包括口腔和其他面部肌肉,但思维还是清晰的。


这项实验创下了一个用意念(mind)打字的新纪录:一只猴子一分钟打出了 12 个单词。「据我们所知,这是目前能达到的最高水平了,」Paul Nuyukian 说,他是斯坦福神经义肢移动实验室(Neural Prosthetics Translational Lab)研究员,也是这项研究相关论文的合作者。

它的原理是这样的:这些猴子的大脑中位于运动皮质的部分植入了微小的电极阵列,这部分控制着四肢运动。当猴子在训练光标控制任务时,那些电极会测量猴子神经元的电活动,首先会移动它们的胳膊,同时相机会小心地跟踪着这些动作。机器学习算法在数据流中发现模式,并将这些模式转换成猴子的一个意图来移动光标向左,向右,向上,向下。


去年大脑打字的记录是一名 ALS 患者创下的,一分钟打出 6 个单词。那项试验的研究者团队更大,其中也有 Nuyujukian,他是 BrainGate 联盟的成员。今年能创下新纪录还是要得益于之前研究中的软件;猴子们使用的系统中装了两个聪明的串联的算法,一个用来解码光标的移动,另一个用来解码猴子要点击哪个字母的意图。


Nuyujukian 在采访中告诉 IEEE Spectrum,这项技术还有很大的提升空间。目前这些猴子使用接口一次只能选一个字母,他说,但是未来的接口可以借用一些智能手机上的小技术。


「我能想象出一个更加聪明的接口,它能自动完成这些单词。谷歌和苹果已经做了很多研究工作,试图从我们不精确的手指移动中获取最大化的信息输入,我们可以大大利用这个技术。」


该技术的人类试验已在进行中。在去年的某个大会上,研究者们展示出了一项试验,试验中一名患有 ALS 的女性使用了一台外接安卓平板电脑的光标控制系统来浏览网页、写邮件。这类人类试验说明这些研究者并不是在开什么莎士比亚猴子的玩笑。他们正在尝试帮助那些瘫痪的人能够实现一定程度上自理,赋予他们表达自己思想的能力。但是这些研究者们自己的乐趣并不太多。Nuyujukian 泄露了猴子们早期用这个测试系统打出来的文字,「A banana, a banana, my kingdom for a banana!」以及「a banana by any other name would smell as sweet.」




  • 论文:一种非人灵长类动物的大脑–计算机打字接口(A Nonhuman Primate Brain–Computer Typing Interface)

摘要:脑机接口(BCI)可以记录大脑活动并将这些活动信息翻译成有用的控制信号。它们能用来帮助瘫痪的人通过控制计算机光标或者机器义肢这类终端执行器恢复部分身体功能。通信神经假体(Communication neural prostheses)是在计算机或移动设备上控制用户界面的脑机接口。我们给两只猕猴植入电极阵列,模拟打字任务,以此展示了一副通信假体。猴子们用了两个目前性能最好的 BCI 解码器,通过一次只提示一个符号/字母的方式,打出了单词和句子。平均来看,使用只与速度相关的二维 BCI 解码器(该解码器根据停留时间(dwell)从符号中进行选择)从一篇报纸文章上复制文本,猴子 J 和猴子 L 的打字速度分别达到了 10.0 个和 7.8 个每分钟(wpm)。有了一个能离散点击关键选项的 BCI 解码器后,打字速度分别上升到 12.0wpm 和 7.8wpm。这是目前使用 BCI 进行沟通能达到的最快速度。然后我们量化比特率和打字速度之间的关系,发这个关系现近似线性:打字速度(以 wpm 计算)是比特率(以字节/秒计算)的三倍。我们还比较了能达到的比特率指标和信息转换速度,并讨论了它们适用于现实世界的打字情境。虽然这项研究还不能模拟单词认知负荷和句子规划(sentence planning)的影响,但它证明了 BIC 作为通信接口的可能性,并代表了对于一个给定 BCI 吞吐量期望能实现的打字速度上限。


论文地址:A Nonhuman Primate Brain–Computer Typing Interface

入门脑机接口机器学习工程论文
返回顶部