王三错作者

强人工智能离我们还有多远?

导语

人工智能的概念从1956年8月的达特茅斯会议诞生已来,已经经历了60多年的历史,近几年AI在国内的发展呈井喷之势,不断刷新人们的眼球,笔者作为一个科研工作者,尝试从客观的角度对AI的进一步发展做思考和分析。

发展历程

现有的AI大致经历了三个发展阶段:

1956~1976年 基于符号逻辑的推理证明阶段

这个阶段的AI主要使用的是逻辑推理的方法来做一些数学定理证明的工作,但是由于理论方法和工具的局限性,这个阶段的AI受到了来自多方的质疑,并没有快速发展起来;

1977~2006,基于人工规则的专家系统阶段

第二阶段的AI从逻辑推理逐步上升为专家系统和知识工程,并使用神经元网络BP算法解决了收敛性等的问题,该阶段的AI已经可以实现字符识别和简单的图像诊断;

2007~至今,大数据驱动的深度神经网络阶段

第三阶段的AI得益于大数据深度学习模型和算法,发展迅速并得到了大规模应用,在人脸识别语音识别机器翻译、智能问答等领域取得巨大成功。

到目前为止所有的AI都是弱人工智能,弱人工智能也叫狭义人工智能(Narrow AI)是指人工系统可以达到专用或特定技能的智能。我们大众所理解的人工智能叫强人工智,也叫通用人工智能(Artificial General Intelligence,AGI),它类似科幻小说和电影中的智能机器人或是人造生物。它具有和人类同等智商、情商以及行为能力,甚至在某些方面超出人类的能力,并能够表现和执行人类所有的智能行为。而弱人工智能不具备自主意识,永远无法替代人类,只能作为服务人类的机器。

分析及讨论

人类的进化发展经历了几十万年的漫长岁月,从语言、社会、思维的发展,再到农业文明、工业文明,各个阶段不断突破,才进化到现在的智人阶段。反思AI的发展,弱人工智能也将经过一个漫长的发展阶段才能逐步接近强人工智能。从目前的进展来看实现强人工智能还需要解决很多技术层面的问题。

存储问题:现在的计算机虽然已经能够存储大量的信息,但相对于人脑来说还远远不够。一个正常人的大脑约有1000亿个神经元神经元之间还有大量复杂的突触连接,人类大脑的记忆和工作是以神经元和突触连接共同完成的,这样就使得人脑的存储容量呈指数级别的增长。曾有心理学家测算人脑的存储量约有100万亿比特(约64PB),2014年科学家通过对老鼠神经元的分析推算人脑容量约为7.6亿TB,但实际人脑容量上远远不止这些。人的大脑在被其感兴趣的事物激活时,会调动更多的神经元共同参与并建立更多更复杂的突触连接,这将大大增强人脑在相关事物的存储能力和信息检索能力。而且人脑的实际应用一般只相当于大脑总容量的十分之一,很多内容被大脑存储在潜意识中,通过潜移默化的影响控制人们的行为和思考方式。

学习能力和工作模式:现有AI技术是通过输入大量数据的基础上不断训练,在分析和处理过程中模仿生物和人类大脑的思维模式,并逐步达到收敛的效果而形成算法模型。这种模式在处理结果明确,逻辑相对简单的问题上效果很好,但在处理复杂问题、因果关系不清晰的问题时效果很差。AI现在可以轻松打败围棋高手,进行准确的人脸识别,这些应用的特点是都具有有限的规则和相对明确的结果。现实世界中,人类大脑的知识库系统包含从领域常识性知识到原理知识、经验性知识、元知识等多层次的知识内容,在面对复杂环境和决策的时候,人脑可以协调所有内容进行符合逻辑的判断。但AI一旦遇到冲突和不协调的情况发生,无法结合具体场景和复杂的环境因素来进行理性的判断和决策。此外,人类的想像能力、奖励机制和其他一些复杂的生理机能,也是促使人脑不断进化和产生突变的因素,而这些都是现有AI技术所不具备的。

情绪感知:AI要想真正实现跟人类无障碍交流还需要准确理解和感受人的情绪。在人与人的沟通和信息交流中,语言和文字大约只占到7%,大量的信息是通过语音语调、面部表情和肢体动作等表达出来的,人们甚至可以仅仅通过一个细微的眼神变化就能表达和传递复杂的信息,宠物狗也能从主人的语言、表情动作等方面了解人类的情绪状态。人类的情绪每时每刻都在影响人的行为和判断,移情、共情等能力是人类建立现代社会和文明的一个重要基本因素,没有情感的AI永远不会“意识觉醒”,也永远无法和人类进行无障碍的沟通。

结论

AI发展还需要和其他学科和技术紧密结合才能逐步实现强人工智能,脑科学、神经科学、生物技术等等都将在未来和AI深度融合,才能弥补现有技术的不足、补齐短板。5月2日发表在Science杂志的一篇论文中,MIT的三位神经科学家已经可以通过人工神经网络准确控制猕猴视觉皮层的活动,笔者相信科学家将逐步破解人脑的工作机制,并将利用相关的研究成果来不断来提升机器的智能,未来的10到50年AI将会是类生物智能机器人、半生物智能机器人和生物机器人多样化发展的时代。

作者:王三错,信息管理专业博士、新华网科技记者、技术主管,主要从事前沿科技的研究和技术探索,善于从多学科、多角度、多层面分析问题,目前主要研究方向为情感计算和类脑计算。

产业强人工智能
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

专家系统技术

专家系统(ES)是人工智能最活跃和最广泛的领域之一。专家系统定义为:使用人类专家推理的计算机模型来处理现实世界中需要专家作出解释的复杂问题,并得出与专家相同的结论。简言之,如图1所示,专家系统可视作“知识库(knowledge base)”和“推理机(inference machine)” 的结合。

信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

弱人工智能技术

弱人工智能(weak AI),也被称为窄AI,是专注于某一特定狭窄领域任务的人工智能。 相对于可以用来解决通用问题的强(泛)人工智能,几乎目前所有的人工智能都属于弱人工智能的范畴I。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

神经科学技术

神经科学,又称神经生物学,是专门研究神经系统的结构、功能、发育、演化、遗传学、生物化学、生理学、药理学及病理学的一门科学。对行为及学习的研究都是神经科学的分支。 对人脑研究是个跨领域的范畴,当中涉及分子层面、细胞层面、神经小组、大型神经系统,如视觉神经系统、脑干、脑皮层。

收敛技术

在数学,计算机科学和逻辑学中,收敛指的是不同的变换序列在有限的时间内达到一个结论(变换终止),并且得出的结论是独立于达到它的路径(他们是融合的)。 通俗来说,收敛通常是指在训练期间达到的一种状态,即经过一定次数的迭代之后,训练损失和验证损失在每次迭代中的变化都非常小或根本没有变化。也就是说,如果采用当前数据进行额外的训练将无法改进模型,模型即达到收敛状态。在深度学习中,损失值有时会在最终下降之前的多次迭代中保持不变或几乎保持不变,暂时形成收敛的假象。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

逻辑推理技术

逻辑推理中有三种方式:演绎推理、归纳推理和溯因推理。它包括给定前提、结论和规则

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

情感计算技术

情感计算(也被称为人工情感智能或情感AI)是基于系统和设备的研究和开发来识别、理解、处理和模拟人的情感。它是一个跨学科领域,涉及计算机科学、心理学和认知科学(cognitive science)。在计算机领域,1995年Rosalind Picard 首次提出affective computing。研究的目的是使得情感能够模拟和计算。这个技术也可以让机器人能够理解人类的情绪状态,并且适应它们的行为,对这些情绪做出适当的反应。这是一个日渐兴起的兴欣领域

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

强人工智能技术

强人工智能或通用人工智能(Strong AI或者 Artificial General Intelligence)是具备与人类同等智慧、或超越人类的人工智能,能表现正常人类所具有的所有智能行为。强人工智能是人工智能研究的主要目标之一,同时也是科幻小说和未来学家所讨论的主要议题。相对的,弱人工智能(applied AI,narrow AI,weak AI)只处理特定的问题。弱人工智能不需要具有人类完整的认知能力,甚至是完全不具有人类所拥有的感官认知能力,只要设计得看起来像有智慧就可以了。由于过去的智能程式多是弱人工智能,发现这个具有领域的局限性,人们一度觉得强人工智能是不可能的。而强人工智能也指通用人工智能(artificial general intelligence,AGI),或具备执行一般智慧行为的能力。强人工智能通常把人工智能和意识、感性、知识和自觉等人类的特征互相连结。

神经元技术

(人工)神经元是一个类比于生物神经元的数学计算模型,是神经网络的基本组成单元。 对于生物神经网络,每个神经元与其他神经元相连,当它“兴奋”时会向相连的神经元发送化学物质,从而改变这些神经元的电位;神经元的“兴奋”由其电位决定,当它的电位超过一个“阈值”(threshold)便会被激活,亦即“兴奋”。 目前最常见的神经元模型是基于1943年 Warren McCulloch 和 Walter Pitts提出的“M-P 神经元模型”。 在这个模型中,神经元通过带权重的连接接处理来自n个其他神经元的输入信号,其总输入值将与神经元的阈值进行比较,最后通过“激活函数”(activation function)产生神经元的输出。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~