Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

为何最强人工智能比不上婴儿大脑?

机器可以理解语音、识别面部和安全驾驶汽车。这让人们十分讶异于近期的技术方面的进步。但是,如果人工智能领域想要实现革命性的跨越,从而建造出类人式的机器,它首先将要掌握婴儿的学习方式。


「在相对最近的人工智能中,人们从想直接设计一个可以完成成人做的事情的系统转变成一种认识——即如果想要有一个灵活和强大的系统来完成成人做的事情,这个系统需要能够学习婴儿和孩子做事情的方式。」加州大学伯克利分校的发展心理学家 Alison Gopnik 说,「如果你将现在计算机可以完成的事情与 10 年前可以完成的事情相比较,它们已经取得了很大的进步,但是如果你将这些事情与一个 4 岁儿童可以做的事相比较,仍然有相当大的差距。」


婴儿和孩子使用一种和科学家用来构建科学理论的相同的方法来构建关于他们的周围的世界的理论。他们以一种系统的和实验性的努力来探索和测试他们周围的环境以及环境中的人,这对于学习至关重要。


Gopnik 最近和一组研究人员一起研究揭示了 15 个月大的孩子相比年龄更大的孩子是如何使用统计数据来更好地学习因果关系的。婴幼儿也许是更好的学习者,因为他们的大脑更加灵活或者「可塑性」更强 ;他们较少地被背景知识所影响,这也让他们有着更加开放的头脑。大脑并非是不变的,而是随着每一次学习的经验而改变。


通过将发展心理学家和计算学家的专业知识相结合,人们可以揭示出世界上最好的学习型大脑是如何工作的,并且将其计算能力转化到机器的身上。最近,人工智能需要大量的数据来提取模式和结论,但那些对周围世界有相对较少数据的婴儿使用的是一种被称为贝叶斯学习(Bayesian learning)的统计评估方法(参阅机器之心文章《深度 | 大脑认知机制是贝叶斯式的吗?》)。也就是说,这种理解并非是基于一个结果的已知频率(婴儿所没有的信息),而是基于当前的知识推断出的事情发生的可能性,其随着新接收到的信息而连续调整。


「令人震惊的是,婴儿可以只看到一次或听到一个新单词的时候,他们就已经对这个新词的可能意思和可能的使用方法等有了一个很好的认识了;」Gopnik 说。「所以这些贝叶斯方法很好地解释了在没有充足数据的情况下,这些孩子为什么如此擅长于学习。」


婴儿们使用概率模型通过组合概率和可能性(probabilities and possibilities)来得出结论,从而创造出各种假设。随着大脑的成熟,它变得更加专业化以便执行复杂的功能,因此也变得不那么灵活,越来越难以随着时间而改变。年长的学习者发展出了有偏见的观点,因为他们更多地了解世界并且加强某些神经连接,这阻碍了他们基于很少的信息来形成具有创新性的假设和抽象理论的能力。这种能力使得 5 岁以下的婴儿和儿童茁壮成长。


「这种权衡关系就是,你知道的越多,你就越难以考虑新的可能性,」Gopnik 说。「你知道的越多,你就越依赖于你知道的东西,而对新的东西则不能保持一个开放的态度。从进化的角度来看,婴儿的整体情况就是他们不知道那么多,所以他们可以更好地学习新的东西。」


在婴儿刚出生的几年,每一秒都有 700 个新神经连接生成,这是让一个灵活的大脑处理快速积累的来自环境和社交的信息所必需的部分。比起在成年时期重新组合大脑回路,生命早期的可塑性使得从零建立大脑的架构更加容易。贝叶斯学习已经被证明是儿童发展中的一个强大工具,计算机科学家正在使用该模型设计智能学习机。


麻省理工学院大脑和认知科学系的教授、计算认识科学家 Joshua Tenenbaum 说:「贝叶斯算法正在试图捕捉婴儿的学习模式,」他正在与 Gopnik 合作进一步研究其计算机和心理学的混合领域。「当这些孩子进入了真实的世界时,就已经有准备好的基本的构建模块来让他们理解一些最复杂的概念。然后,他们有学习机制——即以这些最初的构建模块来尝试从稀疏数据推理,并创造因果理论。」


人类的大脑,不管处在哪一个发展阶段,都是被设计通过一系列的感觉系统,包括视觉、听觉、嗅觉、味觉、触觉、空间取向和平衡从而进入物理世界。当一个人只有有限的数据时,大脑就会填补空白,这是一种被称为「退化(degeneracy)」的神经结构现象。尽管婴儿的大脑缺乏一个或多个感知,但是他们还是尤其擅长处理信息。


Tenenbaum 说:「为了理解世界,孩子们会像科学家一样学习,这包括形成理论、进行试验、玩耍并且看看到他们可有所发现的东西,积极思考什么是正确的方法来测试他们的理论或者应对一些他们没有想到的东西,并试图找出什么是错,什么是对。」

采取孩子的措施

Tenenbaum 和来自纽约大学和多伦多大学的研究人员团队合作设计了一种能够以更有效和更复杂的方式捕获新知识的人工智能软件。在 2015 年 12 月,他们的研究论文《Human-level concept learning through probabilistic program induction》指出用于创建计算机的机器学习算法接近我们所处理信息的方式;该论文已发表在 Science 杂志上。


新的人工智能程序可以在看到一个样本之后就像人类一样准确地识别手写字符。使用贝叶斯程式学习框架,软件能够为每个至少看到一次的手写字符生成一个独特的指令。但是,当机器面临一个不熟悉的特性的时候,这种算法的独特功能就发挥了作用。它从数据搜索转换到寻找匹配,使用概率程序并通过组合已经见过的字符的部分和子部分来创建一个新的字符以此检测其假设——即当婴儿面对他们从未见过的角色和对象时,他们如何从有限的数据中学习到丰富的概念。


然而,软件仍然无法通过形成原始假设自主学习方式模仿孩子学习的方式。当研究人员能够设计具有原始假设和真实的目标的软件时(例如产生识别字符的愿望而非遵循研究者的指令),人工智能系统的潜力将会有里程碑式的转变。没有自我驱动的目标,人工智能系统就限制了他们自主运作的潜力。


Tenenbaum 说:「使用越来越多的数据进行的持续性学习是任何人工智能系统都想要做到的,但自主学习却是棘手的,因为总会有人来操控整件事情,数据的数量与类型也由他们给出。婴儿是自主选择的,但是要让人工智能系统能够更自主地构建自己学习过程仍旧是一个众所周知的挑战。目前的人工智能系统并没有建立任何目标,应此它们也无法为自己的学习负责。当一个机器人按指示拿起一个盒子时,看着它们做着和人类一样的事情是非常令人欣喜的,然而它们并不会拥有像孩子那样复杂的思维水平。」


Tenenbaum 和他的同事采用了在神经元的虚拟网络上建模的深度学习算法。它建造了一个非常初步模仿人脑的工作方式。当机器处理一个对象时,它搜索其巨大的数据库来获取与机器匹配的像素以进行识别。而人类依赖于更高形式的认知功能来解释对象的内容。


「我们正在试图编写像大脑的软件一样的计算机程序,这通常被称之为思维。思维是程序且运行于大脑这个硬件上,我们就是试图在对准软件层面。神经网络在人工智能中就像计算机程序的软件层面一样。」


在 2013 年,美国国家科学基金会拨款 2500 万美元资助了麻省理工学院一项为期五年的项目,用于建立脑、思维和机器中心。为了解大脑如何执行复杂计算,不同领域的科学家和工程师共同合作,希望构建更类似于人类智能的智能机器。


Tenenbaum 说:「近期我们才建立出一个能够做到这一点的数学与计算机模型,我们将需要更多的资源、人才、公司、技术和公司的利益以及更快的计算机。我们可能需要等待或依靠其他工程进展,然后才能赶上即使是非常幼小孩子的智力。」

构建第一个婴儿大脑

新西兰的奥克兰大学生物工程研究所正在试图通过一个动画制作的可互动的婴儿来弥合大脑和机器之间的差距。Mark Sagar 是该研究所动画技术实验室的导演和创始人,其动画作品《阿凡达》和《金刚》获多项奥斯卡奖。他在实验室和一个叫做 BabyX 的 3D 电脑屏幕上的金发碧眼宝宝玩躲猫猫,这个 BabyX 是一个能够学习、思考并可以产生面部表情,能够自己做出反应的实时系统。视频点击这里查看


Synced (4).jpg

通过在麻省理工学院建立身体部位的医学模拟,Sagar 开始了他的职业生涯。在那里他致力于实现数字面孔,并使用这些技能开发 BabyX。动画人工智能能够模仿他的面部表情、朗读简单的字、识别对象和播放经典的视频游戏 Pong,这使它每天都变得更聪明。BabyX 不仅是 Sagar 的「大脑宝宝」,也是在他的女儿 Francesca 在不同年龄阶段的模型。


为了构建 BabyX,Sagar 在他的女儿 6 个月、12 个月、18 个月和 24 个月时进行了扫描,并将数据上传到了系统中。他选择通过动画技术来复制他女儿的行为、面部表情和声音,作为人工智能初生的隐喻。Sagar 亲切地将 BabyX 称为「她」,并解释她如何使用光纤电缆:由她的模拟神经活动所驱动,如同脊髓连接到大脑。与之前的系统不同,由于 BabyX 是一个具有人工智能的交互式化身,故它具有学习和保留信息的能力。


「我们不以大多数人所想的方式开发人工智能,」Sagar 说,「在神经科学和认知科学中存在许多有争议的理论,现有知识可能仅代表冰山一角。而最困难但也最深刻有趣的部分是:生物学启发的方法如何从不同规模过程的相互作用中出现更高的认知水平。」


Sagar 和他的团队测试了 BabyX 与人类的互动。BabyX 能够处理人类的情绪、理解他们的行动背后的意义、并根据她过去与 Sagar 的互动中所学的东西做出回应。BabyX 的屏幕之后是一个大脑的实时模拟,使它能够提示面部模拟眨眼和观众报以微笑。Sagar 认为脸部是发展是有效交互式人工智能的关键,因为它是大脑的反映,并揭示了有意识思维的内在运作。例如,一个简单的微笑是脑内连接的复杂、交织系统运行的结果。


「BabyX 通过使用者的行为和宝宝的行为之间的关联来学习,」Sagar 说道,「在一种学习形式中,咿呀声会使 BabyX 探索她的运动空间、移动她的脸或手臂。如果使用者的响应类似,则表示 BabyX 的动作神经元开始通过称之为 Hebbian 学习的过程与响应使用者动作的神经元相联系,共同发挥作用的神经元会聚在一起。」


在重复过程之后,新的神经连接开始在 BabyX 的模拟大脑中创建一个映射,将其动作与使用者的动作相匹配,为更高级的模仿打基础。人类大脑的工作方式大同小异——即通过完成一个动作,大脑形成新的连接并通过重复这个动作而加强。


最终,这个模拟的婴儿通过她大脑处理的环境信息来做出自己的反应。本质上,BabyX 通过不断改进代码进行学习。


BabyX 的学习能力是基于生物学似乎可信的学习模型中,这种算法模拟和翻译人类大脑如何处理信息和释放大脑中的化学反应,例如多巴胺或催产素水平。当她不明白一个单词或动作时,BabyX 显示困惑的表情,但当她正确地读一个单词时,她会快乐地笑起来,并释放更高水平的「快乐激素」多巴胺。每个算法都控制神经系统从而令她能够模仿、建立反馈系统还有通过互动和演示学习新的信息。


「我想探索如何将基于生物学的行为、情绪和认知的计算模型集成到动画中,特别是面部,」Sagar 说道,「面部表情是人类经验许多方面的纽带。这对探索学习和心理发展的基础,甚至可能对我们未来与更复杂、自主技术的相互作用和使用都至关重要。」


由于面部是沟通的一个首要手段,Sagar 希望他的实验可以为未来的健康和教育应用奠定基础,例如旨在与自闭症或其它社交障碍疾病儿童患者进行互动的方案。一个可以感受到人的情绪、处理并了解他们的感受的系统是驱动人工智能研究的目标,这就像我们人生中最初的光阴一样——建立一个可以自己思考的大脑。

入门神经科学工程认知科学
暂无评论
暂无评论~