对话胡郁:AI现状与科大讯飞的机会

编者按:科大讯飞副总裁、研究院院长胡郁在GMIC大会期间参加了闭门媒体见面会,机器之心有幸获邀参加。这是胡郁首次公开面对媒体详细介绍科大讯飞和深入分析人工智能行业。机器之心曾经翻译过IEEE Spectrum对Yann LeCun的专访,此次现场与胡郁交流,感觉他与LeCun的风格非常像,同样是技术天才,同样有着出色的口才和思路,能将非常复杂的人工智能问题和行业现状讲的异常清晰和透彻。

一、人工智能再次火爆的原因:天时地利人和的三要素

人工智能的研究历史可谓几经周折,经历了四次寒冬。而如今又再次变得异常火热,学术界、产业界和媒体界都对该领域表达了广泛关注。深度学习大师GeoffreyHinton、Yann LeCun和吴恩达分别被科技巨头谷歌、Facebook和百度招致麾下;高校研究机构纷纷推出自己的人工智能最新研究进展;众多以DeepMind、Vicarious 为代表的众多人工智能创业公司开始兴起,行业自身的发展加上媒体的大肆宣传使这个行业得到了前所未有的热度和关注。 对于胡郁来说,人工智能一下子火起来是有原因的,核心算法、数据量的增长和应用模式这三个方面的成熟为人工智能的发展提供了天时地利人和的环境,因此,人工智能开始从技术上突破了产业上大规模应用的瓶颈。同时,不管是语音识别,还是图像识别,这些人工智能技术基本都是在同一时间发生了大的变化和突破,这些都和以下三个要素有关,有共性的东西。1)核心算法的提升第一方面是深度神经学习为代表,基于统计模型的整体突破,这个方向被研究了几十年,只有在这方面真正掌握一流的人才才能抓住这样的机会。深度神经网络(DNN)和递归神经网络(RNN)就是可以很好提升图像识别和语音识别能力的核心算法。2)大数据现在人工智能在很多方面是基于统计模型,统计模型里非常重要的就是你要有足够多的能符合我们真实世界的数据样本。以前在实验室环境下很难收集足够多的样本,现在数据容量相对以前在数量、覆盖性和全面性方面都获得了大幅提升,现在所获得数据量更大,更加多维,同时覆盖更全面。因此,对这些海量数据的处理能力就非常重要,需要有超级计算机还有海量存储等工程技术体系的支撑。目前,科大讯飞和百度都拥有这样的数据收集和处理能力。3)应用模式的建立现在与以往实验室技术最大的不同在于,把研究技术、工程、产品、应用、最终用户整个链条打通,形成了大数据、移动互联网、云计算和智能化的整个循环。这是一个不断迭代优化的过程,让每个用户在使用这个技术同时也成为数据的贡献者和经验的分享者。他们在使用过程当中会碰到哪些问题,我们再改进。这种优化能力是一个系统化工程,是互联网公司和讯飞这样的公司,在互联网有很多方面的积累之后才能做到的。这也是为什么以前研究所和学校很难做到。 这三点具有普适性,用在图像、语音都可以,是一个把人才、计算能力以及整合链条建立起来,并将最终用户的数据不断优化的整套体系,这是工业界的人工智能,要想突破大规模应用就必须具备这三个天时地利人和基本要素。而且这三个要素也是互相补充,比如说有了移动互联网和物联网带来了大数据,还要有相应的算法和工程人员,这不是靠一个产品概念能解决的,这个部分需要科学家和工程师一起研究的。 面对「为何人工智能能够再次振兴」这个老生常谈的问题,百度吴恩达曾将人工智能比喻成火箭,其中数据是燃料,算法是发动机,人工智能这个火箭升空需要这两者的配合。LeCun和Hinton等深度学习倡导者们也都表示,计算能力的增强以及数字数据爆炸将会再次推动深度学习研究的发展,而这些将共同促进人工智能的发展。胡郁给出的答案与这些观点类似,都提到了数据和算法的重要性,但同时又提到了应用模式这个要素,这能体现出他在产业界的深厚积累。 而对于科大讯飞来说,首先,其「讯飞语音云」覆盖终端用户数超过6亿,日语音服务量超到1亿次,开放云平台的应用项目8万多个,这将为科大讯飞提供源源不断的数据。其次,科大讯飞在核心算法方面一直具有优势,同时技术基因决定了他们将继续重视对核心算法的研究。最后,科大讯飞把自己定位成以核心技术驱动的产品提供商,有自己的业务方向,同时也作为开放式平台进行多个业务方向和应用场景的尝试。可见,科大讯飞在算法、数据和应用场景结合方面有着深厚的积累,同时这也为科大讯飞后续人工智能领域的发展提供了坚实基础。

二、科大讯飞的人才建设体系

人工智能是一个严重依靠顶尖专家和人才的领域,我们在市场上经常能看到谷歌、百度等科技巨头激烈的人才争夺,从深度学习元老到名校毕业生,再到斥巨资收购人工智能创始团队。而在这方面,位于中国安徽的科大讯飞略显低调,很少能看到他们大张旗鼓的人才引进计划,但在胡郁介绍完科大讯飞独特且科学的人才引进和建设体系后,着实令人钦佩。1)专家、学生和研究人员的良好互动胡郁表示,人才分为几种,有一部分人才是高校的研究负责人,他们比较高瞻远瞩,但不大可能离开学校加入到公司。第二是非常优秀的毕业的学生,他们在老师的带领下做研究工作,毕业后不会留在学校里。第三种人才就是真正进入到科大讯飞研究院的高端人员。 科大讯飞一直跟高校合作,首先就要和具有前瞻性眼光、最有业界影响力的教授建立起合作关系,比如说香港中文大学的汤晓欧教授,他们的图像识别和人脸识别技术在国际上处于领先位置,哈尔滨工业大学的刘挺教授,他们的自然语言处理技术也是处于研究领域的领先水平。还有西北工业大学的陈景东教授,他们在自己所研究的点上可能是世界上最好的。他们并不做实际的产品,也缺乏上面讲到的大数据、大环境优化以及在整个产业中与最终用户打通的能力。而这对于科大讯飞来说是原来自然体系一个延伸,是很自然的事情。其次是与这些专家的学生进行合作,学生跟他的老师相比没有那么全面,但是都在做最前沿、最新的东西。科大讯飞会支持这些学校里的学生做风险性大、尝试性的产品,失败不要紧,学生是培养出来的。学生跟科大讯飞在合作过程中就建立比较深的合作关系以及个人关系,包括一些对产业的认识等。这些学生毕业之后最优秀的一部分人会进入到科大讯飞研究院,这时候因为他已经尝试过很多,或者失败过很多,积累了丰富的经验,因此就可以迅速满足产业上的最新需求,研发一些风险比较小、容易出成果的东西。 将胡郁的观点总结下来,科大讯飞的人才机制就是通过和高校等研究机构合作,在老师、学生和研究人员之间形成一种良好的互动和协作机制。老师和行业专家负责把握大方向,学生进行风险性较高的研究尝试,公司研究人员负责面向最终产品的风险较低、较确定性的研发工作。2)人才战略的国际化科大讯飞就是一家系统创新公司,通过三个途径实现人才的国际化。第一,找国际上这个领域最好的专家给你指导。比如说贝尔实验室的语音组在声学技术、声学建模和解码算法方面都是世界上最强的,当时的负责人是李锦辉教授,科大讯飞很早就和他们建立了关系。第二,科大讯飞要把人派到国际知名研究机构中去,无论是学生还研究人员,进入这个环境里面培养。这些人要长期稳定的做,他们一定是既懂公司的需求,又能接触到世界最先进的东西。第三,积极进行国际交流,一定要参加这个领域的专业会议,在这些会议上真正看到人工智能核心的东西,比如真正解决智能难题的重点算法等等。科大讯飞就是通过这三种方式培养跟国际水平相当的一批人,他们会扎扎实实做技术,并将很多的核心技术点整合起来,形成高水平的系统创新。

三、科大讯飞的业务布局

胡郁详细介绍了科大讯飞的业务布局,这主要分成两部分,第一是通用的人工智能技术和平台级业务,科大讯飞将语音识别、自然语言处理能力授权给第三方,或者与其他公司进行合作,比如说移动互联网和智能家居企业等。这些技术将成为贯穿多个行业的底层技术服务。第二是科大讯飞自己将人工智能技术与优势产业相结合,比如近期的重点业务——互联网教育。胡郁用微软做了类比,Windows操作系统是微软的通用技术,而Office是微软自己重点开展的某个特定方向的业务,而互联网教育就相当于科大讯飞的「Office」产品。1)智能化互联网教育胡郁首先对目前的互联网教育行业进行了解释,他认为人们没有把信息化和智能化分清楚。其实应该有三个步骤,首先你要数字化,能解决很多问题。录音笔就数字化了,原来搞的磁带你就受不了,因为那是模拟的。第二步,数字化之后是信息化,用软件就可以做到。信息化是把数字表示的信息连接在一起,原来人做的事情,现在信息化系统就可以做很高效。电脑是信息化设备不是智能化设备。第三阶段就是当信息化到了一定程度之后,数据大到一定程度之后,可以做一些比较聪明比较智能的事情。 以教育中的阅卷为例,数字化把卷子变成计算机里可以看到的东西,信息化把卷子收集在一起,处理起来不用纸了,可以通过网络传输,通过手机可以看,这是数字化和信息化。智能化就是有了这些信息之后可以自动帮你改卷子,自动评判你说话的流利程度,还有你答题的正确程度,还有就是知道你哪道题答错,知道你哪些题不会,从而可以给你补习。 现在老师比较头疼就是改卷子的问题,高考有一个顽疾就是必须在规定时间内把卷子改完,很多人知道改的有问题,但没办法解决。还有就是没办法改口语考试,因为需要专家来听。但现在通过智能化的手段,口语也可以用机器改,改的跟专家一样。科大讯飞就是在信息化基础上做到了人工智能,讯飞超脑还有教育超脑,这个东西能够帮助解决在学校、老师,家长和学生他们之间面临的一系列痛点和难点问题。 用机器来进行自动口语阅卷,目前在广东高考还有部分地区的中考都已经实现。以前只能改选择题、填空题,问答题和作文等主观题没法改,科大讯飞正在做一些主观改进,做到作文题都可以改。原来是两个老师评,看两个人的分差,现在把其中的一个人换成机器,如果跟机器之间发现分差比较大,再让一个人改,这样可以降低一半的工作量。更重要的是,机器是不断学习的,机器随着学习的东西越来越多,算法不断进步,数据越来越多,总有一天它就比人改的好。 机器自动阅卷属于教学评价,科大讯飞智能化的互联网教育还包括课堂教学,公司有一整套的解决方案,比如大家都知道有一个电子白板,课堂上可以让老师更加方便的来教学,这是属于信息化的部分。坦白来讲,一定要把信息化和智能化结合在一起,科大讯飞的系统里面会融合一些智能化的工作。比如说对于老师讲课的过程会全部记录下来,用智能化的方法给他分析,有一些好的课堂知识点可以给他进行分享,快速的查阅和检阅,并对学生的课堂表现进行自动评价和打分。还有就是家庭学习,这有点像其他互联网教育公司提供的搜题答题工具,也可以讲它是人工智能的一个应用。但科大讯飞正在做的要更深一点,是要能够真正培养一个懂知识点的「老师」,不仅告诉学生答案,还能告诉他推理过程和解题逻辑,并根据学生的答题情况进行个性化辅导。这需要多种技术点的整合,关键点在于要帮助学生真正提高学习成绩(而非完成作业),帮他解决个性化的学习问题。 在教育方面,胡郁还提到了科大讯飞正在牵头研发的高考机器人,这个系统自己学习书本知识,帮学生解答问题,给学生的不仅是最终答案,还有告诉他这道题目怎么解。现在可以看到的系统都是用搜索的方法做,这个题以前出过是可以找出来答案,但是题变一个参数就找不到答案,而现在正在研发的系统是告诉他们解题思路的,新的题目也可以自己分析出来。 查阅科大讯飞近期的公告发现,该问答机器人是科大讯飞作为总牵头单位所承担的「863计划」类人智能项目,其联合清华、北大、复旦、哈工大、中科院自动化所、软件所等全国30多家高校和科研机构,集结了国内超过60%的人工智能专家,研发最终能通过高考的类人答题机器人,这将为本项目提供针对教育领域的高级认知智能的全新支撑。科大讯飞董事长刘庆峰此前也表示,问答机器人是「讯飞超脑计划」的重要组成部分,未来要让机器人参加高考,并且可以考上重点院校,甚至是清华、北大、科大。他说,让机器考及格很简单,因为机器有着极强的记忆能力,而让它考高分则有难度,涉及到让机器具备推理和学习能力,一旦成功,这将会是一个巨大突破。 如胡郁所说,目前绝大部分互联网教育公司都是处于教育信息化,或者是初级智能化阶段,只是提高了消息流通效率,并没有提供更多智能化的服务,而教育本身就是一个需要强大智力支持的领域,单靠数字化和信息化根本无法达到好的教育效果,也无法真正满足用户的个性化教育需求。而从另一方面来讲,众多拥有人工智能技术的科技巨头和创业公司并没有将该技术应用于互联网教育方向。科大讯飞恰恰是将这两者结合在了一起,如胡郁所说,这两方面要平衡,人工智能技术和应用层面的需求要同等重视。这将帮助科大讯飞在互联网教育领域实现重大突破。 科大讯飞在教育领域已经取得了众多成绩,在语音评测方面,科大讯飞是唯一经过国家语委权威鉴定,并在全国31省市普通话等级考试中全面使用的技术,英语口语评测系统在广东、江苏、广西、重庆等10余省市的中高考英语考试中实施。语音合成方面,已经连续9届获得Blizzard Challenge国际合成大赛冠军,是唯一超过普通人发音水平、符合中小学课堂教学要求的技术。中英口语翻译方面,科大讯飞超脑计划的口语翻译获得了2014国际口语机器翻译评测比赛英汉口语双向翻译第一名,完胜美国麻省理工学院、日本国家通信技术研究所、香港科技大学、英国爱丁堡大学等世界一流高校和机构。此外,科大讯飞在全国中高考数据中心年阅卷数量超过1亿份。 而科大讯飞在互联网教育的发力还刚刚开始,近期公布的定增计划中有18亿将投入「智慧课堂及在线教学云平台项目」。这包括教育资源平台、课堂教学软硬件产品、教学质量测评与分析系统和基于大数据分析的在线学习系统。2)开放平台和对外合作业务胡郁表示,除了科大讯飞自身的重点项目互联网教育之外,科大讯飞还与第三方合作或提供技术服务。在这方面,科大讯飞重点关注的领域是移动互联网(包括讯飞输入法和灵犀)、智能家居、电信运营商智能语音服务、智能车载系统、政府便民工程。比如说在运营商的音乐业务中帮助用户识别歌曲;为政府的信息化和便民工程提供支持,利用大数据和人工智能的技术将政府很多内部数据打通,让市民办理一些政府业务时更加高效,比如原来办理护照花很长时间,现在只需要原来很短的时间就可以做到。还有为智能家居和车载系统提供语音交互方面的技术支持。 与第三方合作是通过「科大讯飞云平台」来实现的,第一,这是一个平台级产品,它为科大讯飞的语音能力向各个行业的输出提供一种方式。原来是采用软件授权的方式,但这无法获得最终用户的使用情况,也无法对其进行优化,效果无法提升。而采用云计算技术之后,可以不停地对技术服务做各种各样的提升。第二,这是一个很好的创新实验平台,科大讯飞自身可能并不知道语音应用在哪些地方用,用的好还是用的不好。但有了这个平台之后,科大讯飞就知道上面的各种应用用的的好不好,有什么缺点,并进行很好的完善。在这个过程当中科大讯飞可以得到相当多的有价值的数据,虽然这些数据可能还无法马上体现出价值,但从长远角度来讲是非常值钱的。 在与第三方合作中,广受大家关注的可能是今年3月份科大讯飞与京东签署投资合作协议,双方拟共同投资1.5亿元设立讯京信息科技有限公司,联手在智能家居和语音技术领域展开全面合作。胡郁表示,这个项目的目标是要做一个标杆出来,以填补现有市场上的空白。科大讯飞将自身在人工智能核心技术方面的优势跟京东整个家电的影响力和渠道方面的影响力结合在一起,旨在打造一款真正有标杆性的东西。这里的技术问题很多,科大讯飞正在集中解决这些问题。关于产品形态,胡郁说这是一个和智能家居相关的产品,很快就会出来。3)讯飞超脑科大讯飞近期的定增计划中有3.5亿人民币是投入到「讯飞超脑」项目,根据其公告,科大讯飞在其已有的人工智能核心技术基础上,开展「讯飞超脑」项目研究, 突破新一代人工智能在语言理解、知识表示、逻辑推理和自主学习方面的认知智能技术体系。整个项目包括关键技术研究、云平台开发、数据资源及众包平台建设的相关软硬件设备。 胡郁也对「讯飞超脑」进行了更加具体的解释,他说:现在逐渐可以把人工智能的思路梳理出来,首先要回答人工智能是什么的问题,回答人工智能什么时候能够突破的问题,还有人工智能怎么突破的问题。人工智能现在处于什么样的阶段?从广泛的概念上来讲,现在任何一个公司都可以讲是人工智能公司,只要它用一些和人工智能领域相关的算法。但是像讯飞这样能够把人工智能讲的如此清楚,知道自己明确的目标并将人工智能真正应用到自身的优势产业方向的并不多。「讯飞超脑」是讯飞公司面向人工智能领域开展的重大技术攻关项目,目标是支撑讯飞公司的核心技术研发从感知智能阶段延伸拓展到认知智能阶段,帮助科大讯飞实现从让任意设备「能听会说」到「能理解会预测」的技术跨越。在讯飞超脑项目上,我们有非常明确的目标导向,同时还有清楚的路径和实现方式,包括我们怎样去做,哪些人去实现等等。 总结下来,讯飞超脑应该是一整套综合的人工智能实现路径和解决方案,这和胡郁所说的科大讯飞是一家「系统创新」公司的理念非常吻合。

四、科大讯飞与国内其他人工智能公司的竞争与合作

当被问到如何看待科大讯飞与国内一些科技公司在人工智能领域的竞争时,胡郁表示,他们不是竞争关系,而是合作关系,人工智能领域的公司几乎不存在竞争关系。 胡郁认为科大讯飞和百度是要共同推进中国在人工智能领域工业界落地的进展。没有任何公司会在人工智能领域进行竞争,大家更多的是合作关系,共同推动人工智能这个东西的共同的良性的发展。公司真正的竞争是落在行业层面。 所以,科大讯飞并不担心别人的技术超越自己,除非对方是技术提供商,讯飞刚开始时是提供技术的公司,会跟其他提供技术的公司进行正面PK。但现在的讯飞已经成为一家以核心技术驱动,通过最终的实用产品来解决用户需求的公司。比如说教育、政府的信息化、车载、移动互联网和安全领域等等,如果存在竞争的话,是在这些方面展开竞争。还有一个存在竞争的层面就是人才的竞争。 讯飞最关心两个问题,第一,科大讯飞在自身需要的人工智能核心技术领域是世界上最先进的。第二,在公司具有优势的业务领域,自己的人工智能技术能够发挥作用。科大讯飞选择的教育、移动互联网、智能家居、车载以及和京东的合作,都需要人工智能技术来保障业务创新。 胡郁希望中国做人工智能的公司越来越多,这样人才也越来越聚集。但是对于当前中国信息产业领域的人工智能公司,大家需要一起发出更大的声音,向政府或者是广大用户正确的阐述当前工业界可以实现人工智能的目标和路径,这对于培育整个市场是有好处的,可以把整个大的势头建立起来,对于中国正在这个领域确立在国际上的地位也非常重要。科大讯飞要联合百度以及其他创业公司一起去把这个目标实现好。

五、科大讯飞的定位和愿景

1)一家通用人工智能公司我们对科大讯飞的认识可能是其拥有出色的语音识别技术,当被问到科大讯飞的技术研发时,胡郁表示科大讯飞是一家综合的人工智能公司 科大讯飞原来是做语音,语音是人工智能的一部分,除了语音合成和语音识别之外,科大讯飞还有图像识别、声音认证和指纹识别等等,现在也在围绕认知智能方面的研究希望可以实现突破(能理解知识、进行推理和自主学习的智能系统)。在具体研发上,科大讯飞不仅自己做,在一些潜在性方向还会跟世界上最好的研究院所和单位一起合作。公司原来做语音时是和中国科学技术大学和清华大学进行合作。做语言技术我们跟哈尔滨工业大学还有西北大学有很紧密的合作关系。在图像识别方面现在跟香港中文大学的汤晓欧教授合作,但这些研究者缺少上面讲到的大数据、大环境优化以及在整个产业中与最终用户打通的能力。而这对于科大讯飞来说是有条件有基础的,从而能够很好的实现产学研深入合作。2)基因决定了对核心技术的持续投入任何公司都要盈利,评判一个公司财务能力是非常重要的,关键还是它赚钱之后用来干什么。赚钱只是当前的阶段,比如你的市值很高,你获得这么高市值之后,你得到很多利润之后,你会往哪个方向做。有的公司选择继续资本投资,也有很多伟大的公司就是这样。有的公司说继续做市场,进入更多领域。有的公司去开发更多产品。而讯飞的基因就是如果赚钱了,还会继续投入到人工智能等核心技术研发上,哪怕它还要很长时间才能取得下一步的收益,这是基因决定的。3)科大讯飞的目标科大讯飞有三个明确的目标,第一是促进人机之间和人人之间信息沟通无障碍;第二是为了少年儿童的健康快乐成长;第三是为了国家信息安全和民族文化传播。我们希望通过技术创新的方式并结合好的商业模式做到这一点。这是大家比较看好讯飞的原因。 最后,胡郁用一句话总结了科大讯飞的未来愿景,科大讯飞是在人工智能领域靠技术创新来不断获得用户价值和市场价值这么一家公司。

六、对目前人工智能领域的评价

1)产业界关心现实问题,关心如何用现有技术解决用户需求胡郁在上文中提到了目前人工智能再次爆发的天时地利人和,他重点强调了产业界不关心那些虚无缥缈的问题,比如大家讨论人工智能是不是要毁灭人类,这在短期内不是产业上应该关心的重点。 大家都注意到了一些AI威胁论,那都是有钱有闲人的事情。即便把人工智能这个技术突破了,它不会有自己的意识情感,也不会考虑到危害还是不危害人的情况。我们现在连它最基本的认知、知识掌握还没解决。从科学家严谨的角度来看,十年之内能不能解决还不确定。因此,我们应逐步推进,根据现在的技术水平反过来设计我的产品,多去考虑一下在现在技术情况下,我们的产品可以解决大家什么问题。 比如在酒店里面,你们住一个酒店,你要操纵酒店里的灯和服务是在一个可控的受限环境中,现代技术通过某种工程的优化还有部分的自学习可以满足大家的需求,不要幻想它一定那么智能。从科学家的角度来讲,我们不停的研究新方法,从产品的角度来讲,你现在有什么技术,我如何避免它的缺点,如何利用它的优点做成用户可以接受的产品,这两条路要并行。 胡郁提倡关注人工智能的现实问题,这基本代表了产业界的共同心声。不论媒体多么喜欢追逐马斯克和霍金等人的夸张言论并大肆宣传,产业界依然在关注现实问题,关注现有技术进展,关注如何将现有技术转化成满足用户需求的具体产品。Jordan Pearson曾在文章中指出,马斯克科幻作品般的言论被大肆炒作和宣传,当这样的负面宣传涉及到具体的研究工作时,会产生非常消极和有害的后果。Facebook人工智能实验室的负责人YannLeCun去年在Google+上总结到:「一些不实宣传对于人工智能是非常危险的。在过去的50年里,人工智能就先后因为不实宣传而沉沦了四次。关于人工智能的炒作必须停止。」2)大脑模拟是一个值得严肃讨论的路径,但不适合产业界通过模拟人脑的生理原理以实现人工智能是一个长期主题,控制论奠基人沃尔特·皮茨早在上世界四五十年代就进行这样的研究,用人造神经网络来模拟人类大脑,他的论文《逻辑演算》影响了冯诺依曼现代计算机架构的提出。但皮茨却在后续的研究中发现这条路根本走不通。 如今,这条通往人工智能的路径依然被学术界讨论,只是没有得到产业界的承认。Yann LeCun在接受IEEE采访时表示,他最不喜欢的对「深度学习」的描述就是「它像大脑一样工作」,虽然深度学习从生命的生物机理中获得灵感,但它与大脑的实际工作原理差别非常非常巨大。将它与大脑进行类比给它赋予了一些神奇的光环,这种描述是危险的,这将导致天花乱坠的宣传,大家在要求一些不切实际的事情。 胡郁也认为,对人脑进行模拟这条路径被国际很多人很严肃讨论,但现在不是产业界走的路,是研究界或者是科学界走的路,那条路有可能,但不适合当前产业界急需的人工智能突破。比如说HBP(欧盟人脑计划)和美国人脑计划,它们更多是研究脑生理,针对的是大脑疾病,顺带带个尾巴提出了人脑模拟这个角度,后来有人把它延伸出来说可以通过脑模拟的方法实现人工智能。3)科技公司对人工智能的共识和区别胡郁表示,产业界对于人工智能的观点基本能够达成共识,就是他之前提出的三要素,算法、数据和应用。而区别在于将人工智能技术应用于何种方向,自身擅长哪些产品。 谷歌和美国其他大公司第一是基于以深度神经网络为代表的机器学习算法,基于数学这套东西。第二是基于大数据处理,第三就是基于产业一体化。以应用反过来对产品、技术、研究进行整体的迭代和优化。这个思路上我们跟百度大脑有共识,我们都遵循,包括跟谷歌做的整个一套体系都是一样。这是工业界实现人工智能的路径。但是真正你要讲从这路径出来真正攻克什么领域,大家的目标根据自己的产业优势就可能不一样。 谷歌和百度使用人工智能来解决的问题主要包括搜索、广告、推荐、地图和自动驾驶汽车等,他们有这样的资源。科大讯飞和他们在人工智能的实现路径一样,但目标不太一样,科大讯飞更多关注在感知智能和认知智能,想突破机器怎么掌握人类知识这一点,并将这些成果应用到智慧教育,政府智能信息化,智能家居,智能车载等等领域。4)从感知智能到认知智能胡郁在此前其他的演讲中就提到过,人工智能主要分为计算智能、感知智能、认知智能。感知智能方面包括语音识别、手写识别和图像识别等,认知智能的目标是需要在语言理解、知识表示、联想推理和自主学习四个方面实现突破。 此次胡郁又从技术角度对认知智能的实现进行了解释。感知智能是图象识别、语音识别,认知智能我们还有一段距离,学习能力还有对知识掌握的能力,是我们现在需要努力突破的地方。5)人工智能新方法的优势在传统人工智能方法下,我们首先要人工建立一个庞大的数据库,然后再进行推理。而随着大数据和神经网络的发展,现在尝试用新的方法做。解释的简单一点,就是用一些连续的概率统计,把词和词之间的关系用一种数学方法描述出来。 大家都知道给你们一组词,「男人」和「女人」,「国王」和「王后」,如果按传统的方法来看,「国王」是个男的,「王后」是女的。「国王」和「王后」的差别跟「男人」和「女人」的差别是一样。现在有一种新的方法,是看「国王」和「皇后」这两个词语在所有文本中出现的情况,他跟谁比较接近,他干哪些事情,干了哪些动作,在所有文本描述里面周围的环境是不一样的。它能够用一种概率统计的方法对「国王」和「王后」这些词语周围环境进行概率描述,算出来之后发现跟「男人」和「女人」周围环境的概率是非常强的相关关系。这时候就可以推倒出「「国王」减「王后」」等于「「男人」减「女人」」,并不是真正的建立那个体系,而是分析了「国王」和「王后」在各个地方出现的情况和「男人」和「女人」在各个地方出现的情况总结出来的。 这种新方法能否成功还不确定,但谷歌、Facebook、微软等都在做这方面的东西,想在新的体系下看能不能找到新的方式。也许两到三年内,知识表达解决了,自然理解也解决了,逻辑推理也完成了。形成这个东西之后,机器就可以自动去学习了。 还有一点是,原来我们传统的系统不是按照这种学习方式设计的。我们在实验室里编好程序,然后再放到真实环境中去用。用户怎么反馈我不管(也看不到),我们只按照实验室里一套去我行我素。比如说,春节期间网传的山东大汉与安吉星的对话视频,当司机纠正了所说号码后,安吉星依然在自说自话,没有根据用户的反馈进行相应调整。其实如果机器了解关于这个司机的反馈信息并进行模型思考的话,这样的错误就不会发生,但系统没有学习到这些信息。之前的系统建设缺乏这样的环境,而现在的思路是转变为,一开始这个系统是不聪明的,但用了之后可以观察用户的反馈,从用户反馈中提取信息,包括你系统的评价,告诉你哪个地方不好,系统学习这些东西从而逐步变得聪明,这需要新思路和新方法解决这些问题。以前我们没条件做这个事情,现在我们有条件了。比如说DeepMind发布的那个能够自动玩游戏的人工智能系统,它是自己去运行那个游戏,执行一些动作,再根据死的快不快、得多少分进行强化学习。研究这种方法是一个系统科学,每一个点的实现都需要一个团队。必须掌握最先进的技术,把一个问题定义成一个可解决工程和科学问题,还要想出算法优化它,这需要一个完整的团队,有学生做高风险尝试,还要有研究人员把可行的方案做起来。整个链条上需要这样的人来组合。如果能解决这些问题,让机器具有认知智能才有可能实现。

入门
暂无评论
暂无评论~
返回顶部