Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

打开AI黑匣子,“三清”学子的科学故事

编者按:自然科学一直以来追求的简单之美在人工智能领域似乎正面临着挑战,目前深度学习等主流AI技术趋向复杂和庞大。微软亚洲研究院副院长刘铁岩博士和他的团队一直致力于寻找机器学习中简单而美的规律,提出了对偶学习、推敲网络等重要技术突破,这些突破的背后,是刘铁岩博士“灵感驱动”的科研工作和前瞻的行业洞见。本文授权转载自微信公众号“北京青年周刊”。

刘铁岩博士,人工智能领域的国际知名学者。现任微软亚洲研究院副院长,国际电子电气工程师学会(IEEE)会士,国际计算机学会(ACM)杰出会员,美国卡内基梅隆大学(CMU)客座教授,英国诺丁汉大学荣誉教授,中国科技大学、中山大学、南开大学博士生导师。

刘博士的研究兴趣包括:机器学习信息检索数据挖掘等。他的先锋性工作促进了机器学习信息检索之间的融合,被国际学术界公认为“排序学习”领域的代表人物,在网络搜索和计算广告学等方向取得了卓越的学术成果。近年来,刘博士在博弈机器学习深度学习强化学习、分布式机器学习等方面也颇有建树,发表了二百余篇学术论文,被他引近两万次,并多次获得最佳论文、最高引用论文奖。

“大到天体运行,小到微观世界。所有的规律都逃不出几个公式,若干个参数,一直以来自然科学所追求的正是这种简单之美。可是,目前主流的人工智能技术(深度学习)则有些背道而驰,它从来没有试图寻找如此简单而美的规律。”

我们坐在位于中关村的微软大厦14层的会议室,眼前正在说话的是人工智能领域的国际知名学者刘铁岩博士,他戴着黑框眼镜,身着一丝不苟的蓝色衬衫,正在描述对科学之美的体悟。他的说话方式是缓缓道来且条理明晰,为了让在场的人加深印象,他还会加上适当的手势以作辅助。

前段时间,刘铁岩所带领的微软亚洲研究院机器学习团队与自然语言计算组的同事,以及微软雷德蒙研究院的同事一起参与了在通用新闻报道数据newstest2017的中-英测试集上进行的机器翻译的研究。

为保证结果的可信度,该团队聘请了外部双语评估员,他们对比了微软团队的翻译结果与两组独立翻译的人类译文,评定结果为:微软机器翻译取得了至少和专业翻译人员相媲美的效果

图为中-英新闻翻译能力的过程。

还记得震惊世界的AlphaGo大战李世石,一场人工智能与围棋世界冠军的超级对弈,被全人类通过网络直播共同围观。从此,人与机器的较量拉开了观战的序幕,也吸引了各大科技研究组织、知名企业乃至国家的广泛关注。

刘铁岩作为微软亚洲研究院副院长,同时也是一名人工智能领域的资深研究员。在他看来,现阶段的人工智能领域更像是一个黑匣子,所有人都在慢慢寻找它的边界,试图触碰它的内核,这个领域的研究一直在路上。

“如果没有燃料,机器学习
这艘航空母舰也飞不起来”

与刘铁岩的采访时间是几经交涉才明确下来的。对一直潜心于技术研究的他来说,加之相关管理工作傍身,日常的忙碌是可想而知的。果不其然,在与刘铁岩进一步的交谈中得知,他的日常行程几乎是无缝衔接。

早上七点多到公司,刘铁岩有两个小时的“充电”时间,这是雷打不动的。在这段完全属于自己的时间中,阅读文献是刘铁岩的充电方式,而后随着同事陆续到岗,刘铁岩也开始了自己的日常工作。

团队成员、合作伙伴、实习生、访客,不同的面孔,不同的会议,这些看似日常的安排都会成为刘铁岩技术创新的灵感源泉。他说自己是一位“灵感驱动”的研究员,“很多研究都不是苦思冥想得来的,相反是来自灵光一现的豁然开朗”,其中就包括两项促成了前文提到的中英翻译领域重大突破的独创关键技术——对偶学习推敲网络

起初,刘铁岩的团队发现很多的人工智能任务都是对称出现的,比如中译英与英译中,语音识别语音合成等,这成为了“对偶学习”的灵感之源。而推敲网络的“推敲”二字则来源于人类阅读、写作时的一种行为方式,任务完成之后,并不当即终止,而是会反复推敲,逐步完善。根据这样的灵感启发,团队成员开始设计相应的机器翻译模型,并不断运行试错,直至最终取得突破性结果,站在媒体的聚光灯之下。

这两项技术的突破性意义不言而喻,语言沟通的障碍一直存在于人类社会中,如果可以打破语言障碍,无疑将有助于全人类的交流。但刘铁岩也表示,应该客观地看待这项成果,它是严谨的“学术论文”,表明在特定数据集上,在一定的标准之下,机器翻译取得了突破性进展,并不能说“机器翻译已经全面超越人类”。

对偶学习:解决对标注数据的依赖。利用人工智能任务之间存在的天然对称性(中-英翻译vs英-中翻译,语音识别vs语音合成图像处理vs图像生成),建立机器学习的天然闭环,从而达到弱监督甚至无监督的学习效果。

谈及目前人工智能,或者机器学习领域,刘铁岩表示还有很多挑战需要解决。比如,几乎每一类机器学习进程都离不开“数据”的支撑。“如果没有燃料,机器学习这艘航空母舰也飞不起来。所以,我们经常将‘机器学习’叫做‘数据驱动的人工智能’,因为数据确实是极其核心的存在。”也正是因为目前的机器学习过分依赖数据,所以,如何减少对数据的依赖也成为亟待攻破的难题。

刘铁岩团队发明的对偶学习正是一种可以解决此问题的新型学习范式。它利用人工智能的对称性,可以为模型训练提供有效的反馈信号,在缺乏有标签训练数据的时候,也可以实现高效的学习。对偶学习不仅可以助力中英互译这类数据充足的学习任务取得提高,对小语种互译这类缺乏训练数据的学习任务也是大有用武之地。

刘铁岩形象地将目前主流的深度学习技术比喻为一个“黑盒子”,但是大多数人并不关心它的构造及原理,只是关心它的功能以及如何使用。这个黑盒子到底如何运作,尚未尽在人们的掌控之中。

由于缺乏可解释性,在很多关键性领域,例如医疗和军事,深度学习技术的应用还需要非常谨慎。刘铁岩的团队近期在符号学习知识图谱自动推理等方面进行的有益尝试,其目的正是要解决这方面的问题。

“科学睡前故事,
研究员的后人可能都这样”

每天晚上的九点钟,刘铁岩会准时出现在孩子的床边,这是父子二人的睡前故事时间,此时应该是刘铁岩最放松的时候。刘铁岩讲的故事并不是故事绘本或童话,而是涉及相对论、量子力学、天体物理、化学、生物等较为艰涩难懂的知识。刘铁岩将它们用通俗易懂的方式讲给孩子听,就成为了他口中的“科学故事”。据他所说,孩子总是听得津津有味。在我诧异于此的时候,刘铁岩说到:“研究员的后人可能都这样。”

刘铁岩在黑龙江长大,高中之前的日子都是在那片黑土地上度过的。他有着东北人天生的豪爽,也不否认自己从小就是学霸,是那种“一直都是第一”的类型。采访当天,正值高考第一天,回想起当年自己填报志愿的场景,刘铁岩深叹这是一次“阴差阳错”的经历。

在刘铁岩高考的时候,计算机教育尚未普及,高中开设的计算机课程更像是兴趣班,而且主要是教大家使用数据库。在填报志愿的时候,他特意去咨询了学校的计算机老师,向他请教计算机专业的发展前景。可是,老师对计算机专业的了解也十分有限,认为计算机就是一门“操作性”技能,学术价值不高,建议考虑其他学科。

于是,刘铁岩报考了清华大学的电子工程系,并且以全省英语考生最高分的成绩考入了清华大学这个录取分数线最高的专业。


谈及在清华大学本、硕、博连读的学习生活,刘铁岩的回答很热血,“在清华大学的学习,让我打下了坚实的数学基础、练就了很强的实操能力,以至于我什么方向都敢尝试,即使转型也不怕”。我想,这也是“三清”(清华毕业的学士、硕士、博士)毕业的刘铁岩在微软亚洲研究院三次转型的动力所在吧。

说起来也许是冥冥中早已注定。虽然当年填报志愿的时候,刘铁岩没有选择计算机专业,但是博士毕业之后,进入了微软亚洲研究院,却开始了长达15年的计算机科学领域的研究之路。

研究院的自由氛围为他提供了一个理想的学术环境。在微软亚洲研究院,他从博士期间所从事的信号处理方向的研究转入了信息检索领域,开始了对互联网搜索的探索。后来,他被搜索背后的经济规律所吸引,又开始研究计算广告学和算法博弈论

而第三次转型,他则进入了人工智能和机器学习的核心领域。谈起最近这次转型的动因,刘铁岩的表述透露着一位研究员的伟大愿景,“因为人工智能这个领域能够对各个行业产生更加本质且广泛的影响”。

“人工智能行业是一个飞速发展的行业,
也是逆水行舟,不进则退的行业”

在很多人眼中,科学研究的周期一般都十分漫长。在研究伊始,从获得研究灵感到将其付诸实践,创造出原型系统需要多久时间呢?刘铁岩回答:“其实并不需要很长的时间。”

那么,大量的时间消耗在哪个步骤中呢?

“其实,从第一个原型系统产生到最终形成完善的体系,并且对其他领域产生辐射作用,这是一个相当漫长的过程。这需要研究人员清楚地了解研究雏形和实用技术之间的差别,通过不懈的努力,把研究成果扶上马、送一程,最终转化到产品之中。”

刘铁岩带领的机器学习组的研究员们都是多面手,既能够发明让人眼前一亮的新技术,又懂得如何和产品部门、合作伙伴共同协作,让这些技术落地生根,产生更大的影响力。

我们身处的人工智能的第三次浪潮和深度学习的进展密不可分。但深度学习本身并不是一个全新的概念,它的成功主要归功于三大因素——大数据、大模型、大计算

如今,在微软必应搜索引擎、广告系统、Windows操作系统、Azure云计算平台、Xbox游戏机、微软小冰聊天机器人等诸多产品中,都有着来自刘铁岩团队发明的人工智能技术。

微软亚洲研究院是一个工业研究院,拥有很多微软产品线的资源,这不仅为研究人员的技术提供了用武之地,也为研究思路的产生提供了丰富的“刺激信号”。

2017年,微软亚洲研究院成立了“创新汇”,旨在用微软的人工智能技术去帮助中国的传统产业做数字化、智能化转型。这也为刘铁岩团队的人工智能技术开启了新的出口。

当人工智能技术遇到量化投资、资产配置、风险控制、需求预测、路径规划、物流调度、基因工程、精准医疗等,会碰撞出怎样新的火花呢?

近期,刘铁岩正在负责这些领域对外合作的相关项目。刘铁岩分析说,人工智能赋能传统行业大有可为,它可以帮助金融行业更加充分地利用海量数据、处理市场的动态变化、分析和预测投资人的行为、对投资组合进行优化;可以帮助物流和运输行业利用供应链信息和海量数据对需求和供给进行更加准确的预测、利用强化学习使路径规划更加灵活地适应环境的动态变化和更好地处理非线性的业务逻辑;可以帮助医疗健康行业进行更加快捷和准确的基因测序、发掘出基因和免疫信息与疾病之间的对应关系、做更加精准的诊断和药物研发,等等。

癌症一直是人类最需要迫切解决的医学难题之一,近两年微软亚洲研究院的研究员通过利用人工智能领域中的计算机视觉机器学习技术来辅助医生对病理切片中的癌细胞进行识别和判断

与来自传统行业的合作伙伴一起进行联合研究,为研究员们打开了通向更多领域的方便之门。“我们的研究员接受到了更加广泛和多样的刺激信号,开始了解这些产业,了解用户需求,这远比闭门造车要高效很多。人工智能是一个飞速发展的行业,也是逆水行舟,不进则退的行业。

现在,人工智能的应用范围非常广,为了发明更好的人工智能技术,我们需要跟合作伙伴共同去探索可以与人工智能应用相连接的领域。在实际问题的驱动下,形成抽象的学术问题,发明相应的技术,再反哺应用落地,这是一个良性的研究循环。”刘铁岩如是说。

Q&A

Q:《北京青年》周刊    A:刘铁岩

Q1:你曾经说人工智能的深度学习过度复杂又过度简单,如何理解这两个反义词?

A:我们说深度学习过度复杂是因为它没有去试图探究世界的简单之美。我们这个世界存在着本质的规律,看起来很复杂的世界,背后往往是被几个二阶的偏微分方程所支配。然而现在主流的人工智能技术并没有去深挖这些简单而深刻的规律,而是用非常复杂的模型去拟合数据的复杂表象,以繁治繁。

我们说深度学习过度简单,是因为它试图用一种单一函数拟合的学习模式来处理各种复杂的问题。它忽略了人类智能本身的复杂性和多样性,比如人类的语言系统、知识传承、社会分工、群体智慧等,都远远超出了一个简单的函数拟合的范畴。

Q2:你在与各个领域的合作伙伴商谈时,他们对于人工智能的态度如何?

A:他们对于人工智能的态度都是十分正面的。合作至今,人工智能不仅提升了我们的研究,也让合作伙伴看到了人工智能技术的巨大潜力。我们在智能投资、智能物流领域取得的突破性进展为合作伙伴带来了巨大的经济利益,也为他们的未来发展提供了强有力的保障。

同时经过合作,他们也了解到人工智能的能力范围,人工智能不是去抢他们员工的饭碗的,而是帮助他们的员工更加高效地工作。这对于破除“人工智能威胁论”起到了非常积极的作用。

Q3:在你看来,人工智能扮演了一个怎样的角色?

A:人工智能是一种工具,不是生命体,它本身不会思考,没有自主意识,说得直白点,其实就是一群聪明人编写的复杂程序。人工智能在计算力、记忆、模式识别等方面与普通人相比有明显的优势,但是在创造性、推理决策等方面,还远远没有达到人类的水平。因此,我们所提倡的是人机协作、人机共进化,让人工智能和人类取长补短,共同进步。

刘铁岩所在的微软亚洲研究院人工智能研究团队与东方海外航运携手合作,运用深度学习(Deep Learning)和强化学习(Reinforcement Learning)技术,优化现有的航运操作。东方海外航运每月需处理和分析超过3000万条船舶数据,应用人工智能技术及机器学习服务,有助于进行船期表和泊位活动的预测分析。据悉,此次合作预计每年为东方海外航运节省1,000万美元的运营成本。

Q4:听说你带领的实习生团队有一个很特殊的文化?

A:是的,我们的团队有一种“吵架文化”,就是在头脑风暴过程中不相信权威、 不有所保留,简单直接地表达自己的观点,我一直坚信真理不辨不明。

Q5:在这个团队中会有人员选择的标配吗?

A:在实践中,我发现了做研究的一个黄金组合。我们的实习生很多元,有来自各个高校、不同专业的学生,而不同专业的学生各有特色。比如,物理或做电子专业的学生直觉非常好,他们有很强的对实际问题进行数学建模的能力;数学专业的人非常严谨,可以对数学模型进行分析和理论论证;计算机专业的学生实现能力很强,可以对模型进行大规模的实现和验证。一个由电子或物理专业、数学专业、计算机专业的学生所组成的项目组,通常会发生强烈的化学反应,做出单方面任何一种人都做不到的了不起的事情。

Q6:目前你也在高校带学生吗?

A:是的,但我觉得自己并不是严格意义上的老师。我和学生们的关系更像是合作者。我是那种压抑不住内心想要去表达自己看法的人,所以给同学们直接的刺激信号可能更多一些。

如今的互联网把世界变平了,国内国外的学术环境没有太大差别,比我们读书的那个年代好太多了。在这么好的学术环境下,学生们如果能够更加珍惜、更加努力,那么他们的成长速度一定会比我快5年,甚至是10年,一定会取得比我大得多的学术成果。作为他们的导师和合作者,我拭目以待!

微软研究院AI头条
微软研究院AI头条

专注科研19年,盛产黑科技

产业AI
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习排序技术

排序学习可以是监督,半监督或强化学习,用于构建信息检索系统的排名模型。训练数据通常为包含部分排序信息的列表,该排序通常表示为对每个物体都使用一个数字或序号表示的分数,或者是二元判断(相关或不相关)。排序模型的最终目的是得到可靠的排序,即便列表中的物体未曾出现过。常用的排序学习方法主要有:逐个的(PointWise),逐对的(PairWise)和逐列的(ListWise)。

微观世界技术

MicroWorlds是一个使用Logo编程语言的程序,它是Lisp编程语言的一种方言(变种)。 它使用一个"乌龟物体",其可以移动,给出命令,并最终形成形状甚至动画。现实世界充满了分散和模糊的细节:通常科学通过集中于人为简单的现实模型(例如物理学,无摩擦的平面和完美的刚体)来进步。 1970年,麻省理工学院人工智能实验室的Marvin Minsky和Seymour Papert提出人工智能研究应该集中精力开发人工简单情况下称为微世界的具有智能行为能力的程序。 许多研究集中在所谓的块状世界上,这个世界由平面上排列的各种形状和大小的彩色块组成。

信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

阿尔法围棋技术

阿尔法围棋是于2014年开始由英国伦敦Google DeepMind公司开发的人工智能围棋程序。AlphaGo是第一个打败人类职业棋手的计算机程序,也是第一个打败围棋世界冠军的计算机程序,可以说是历史上最强的棋手。 技术上来说,AlphaGo的算法结合了机器学习(machine learning)和树搜索(tree search)技术,并使用了大量的人类、电脑的对弈来进行训练。AlphaGo使用蒙特卡洛树搜索(MCTS:Monte-Carlo Tree Search),以价值网络(value network)和策略网络(policy network)为指导,其中价值网络用于预测游戏的胜利者,策略网络用于选择下一步行动。价值网络和策略网络都是使用深度神经网络技术实现的,神经网络的输入是经过预处理的围棋面板的描述(description of Go board)。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

博弈论技术

博弈论,又译为对策论,或者赛局理论,应用数学的一个分支,1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》,标志着现代系统博弈理论的的初步形成,因此他被称为“博弈论之父”。博弈论被认为是20世纪经济学最伟大的成果之一

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

信号处理技术

信号处理涉及到信号的分析、合成和修改。信号被宽泛地定义为传递“关于某种现象的行为或属性的信息(如声音、图像和生物测量)”的函数。例如,信号处理技术用于提高信号传输的保真度、存储效率和主观质量,并在测量信号中强调或检测感兴趣的组件。我们熟悉的语音、图像都可以看做是一种信号形式。因此,对于语音、图像的增强、降噪、识别等等操作本质上都是信号处理。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

符号人工智能技术

符号人工智能是指人工智能研究中所有的基于高阶“符号”(人类可读)表示的问题、逻辑和搜索的方法的集合。

暂无评论
暂无评论~