Kathy Pretz作者小舟、张倩编译

机器学习泰斗迈克尔 · 乔丹:不是什么都叫AI的

在可预见的未来,计算机对现实世界进行抽象推理的能力还无法匹敌人类。

人工智能系统还远远不够先进,无法在涉及推理、运用现实世界知识和社交互动等许多任务中替代人类。」机器学习先驱迈克尔 · 欧文 · 乔丹(Michael I.Jordan)说道。

迈克尔 · 欧文 · 乔丹是机器学习领域的权威之一、IEEE Fellow,他为无监督机器学习的发展做出了突出贡献。2016 年,乔丹被《Science》评为「全世界最有影响力的计算机科学家」。他指出:模仿人类的思维并不是机器学习的唯一目标,或者说不是最好的目标。相反,机器学习可以通过对大型数据集进行详尽的分析来提高人类的智能水平,就像搜索引擎能够通过组织 Web 来扩展人类的知识一样。

机器学习还可以汇总多个数据集的信息,探索模式,并为一些问题提出新的解决方案,从而在医疗、商业、交通等多个领域为人类提供新型服务。

乔丹说:「人们在讨论技术趋势时,AI 的含义令人困惑。AI 被认为是计算机中存在的一种智能能力,这种能力让科技取得进步,并且能够与人类相媲美,但事实并非如此。」

近年来,乔丹一直致力于帮助科学家、工程师等 AI 从业者理解机器学习的完整范围。

乔丹指出:机器学习的发展让一个新的工程学领域涌现。机器学习建立在计算机科学、统计学和控制理论数十年的发展基础上,它是第一个以人为中心的工程领域,专注于人与技术之间的接口。

他说:「虽然关于人工智能和超级智能的科幻小说很有趣,但它们却分散了人们的注意力。人们对于真正的问题没有足够的关注,建立基于机器学习的 planetary-scale 系统才是真正有意义的工作,对人类有价值,同时不要放大不平等现象。」

新的改变

乔丹出生于 20 世纪 60 年代,他对哲学、文化观以及思维方式的研究很感兴趣。英国逻辑学家伯特兰 · 罗素的自传让他受到启发,开始研究心理学和统计学。罗素将思维视为一种逻辑数学过程。

乔丹说:「将思维视为逻辑过程,并意识到计算机基于软件和硬件的逻辑实现,我理解了思维的奥秘。我认为哲学可以从关于思维和大脑的模糊讨论转变为更具体的算法和逻辑层面的讨论。虽然我对机器学习很感兴趣,但我很早就意识到理解更深层的学习需要统计学、信息论控制论中的基础知识。」

2003 年,乔丹和他的学生开发了隐含狄利克雷分布(latent Dirichlet allocation,LDA),这是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出,同时它是一种无监督学习算法。该方法让计算机(而不是用户)自己从文档中发现模式和信息,是最受欢迎的主题建模方法之一,用于发现隐含的主题并将文档分类。

乔丹当前的研究主要基于经济学和他早期将计算机科学与统计学结合的思想。他认为学习系统的目标是制定决策或支持人类决策。决策者很少孤立地运作,他们会与其他决策者互动,每个决策者可能都有不同的需求和价值,并且总体互动需要以经济原则为基础。

他正在制定一项研究议程,在该议程中,智能体从现实世界的实验中了解他们的偏好。在收集数据以供学习时,他们会将探索与开发融合在一起。市场机制构建学习过程,从而为学习者提供收集某些类型数据的动机,并做出某些类型的协调决策。这类研究的受益者将是现实世界系统,它将生产者和消费者聚集在注重社会福利的学习型市场中。

重新审视「AI」

2019 年,乔丹在 Harvard Data Science Review 上发表了「Artificial Intelligence—The Revolution Hasn’t Happened Yet」一文。在这篇文章中,他指出,不只是大众对 AI 一词有误解,技术人员也不例外。

时间拨回到上世纪 50 年代,彼时 AI 一词刚刚诞生,人们渴望建造具有人类智能水平的计算机。当前,这一渴望仍然存在,乔丹表示,但这几十年发生了一些不太一样的事情。计算机还没有实现智能化,但它们提供了增强人类智能的能力,擅长低层次的模式识别。例如,基于机器学习的系统能够大规模地检测金融交易中的欺诈,从而促进电子商务的发展。此外,这些系统在制造、医疗保健等行业的供应链建模和控制中也是必不可少的。

他写道,尽管这些进展被称为「AI 技术」,但其底层系统并不涉及高层次的推理或思考。这些系统无法形成人类所掌握的那种语义表示和推理,也不会制定和追求长期目标。

「在可预见的未来,计算机对现实世界进行抽象推理的能力将无法匹敌人类,」他写道,「为了解决最紧迫的问题,我们需要在人与计算机之间促成深思熟虑的互动,需要明白大规模系统的智能行为既来自单个智能体的智能,也来自它们之间的交互。」

此外,他强调,人类的幸福不应该是科技发展之后才考虑的事情,「我们有个真正的机会来构想一个全新的东西:一个以人为中心的工程学科。」

透过这些观点,乔丹重新讨论了工程在公共政策和学术研究中的作用。他指出,有关「社会科学」的讨论听起来往往很吸引人,但「社会工程」似乎就没有这种吸引力。同样的情况也出现在「基因科学」和「基因工程」的讨论中。

「我认为,我们正在眼睁睁看着『工程』这个词从智能领域逐渐消亡,」他表示。当人们想要提及有远见的研究时,大家都习惯用「科学」而非「工程」。只提「工程」这类词没什么帮助。

「回顾科学为人类创造的所有美好,那其实都是工程相关的,土木、电气、化工等最能直接提升人类幸福度的领域都不例外。记住这点非常重要。」

最后,乔丹还谈了谈他对开放出版的看法。他认为,商业出版公司建立的出版模式已经失效,还阻碍了信息的流动。开放出版则有助于信息的流通,加速了学术的传播、交流。

原文链接:https://spectrum.ieee.org/the-institute/ieee-member-news/stop-calling-everything-ai-machinelearning-pioneer-says

理论Michael I. Jordan
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

概率分布技术

概率分布(probability distribution)或简称分布,是概率论的一个概念。广义地,它指称随机变量的概率性质--当我们说概率空间中的两个随机变量具有同样的分布(或同分布)时,我们是无法用概率来区别它们的。

控制理论技术

控制理论是工程学与数学的跨领域分支,主要处理在有输入信号的动力系统的行为。系统的外部输入称为“参考值”,系统中的一个或多个变数需随着参考值变化,控制器处理系统的输入,使系统输出得到预期的效果。 控制理论一般的目的是借由控制器的动作让系统稳定,也就是系统维持在设定值,而且不会在设定值附近晃动。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

隐含狄利克雷分布技术

隐含狄利克雷分布简称LDA(Latent Dirichlet allocation),是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种无监督学习算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量k即可。此外LDA的另一个优点则是,对于每一个主题均可找出一些词语来描述它。LDA首先由Blei, David M.、吴恩达和Jordan, Michael I于2003年提出,目前在文本挖掘领域包括文本主题识别、文本分类以及文本相似度计算方面都有应用。

主题模型技术

主题模型(Topic Model)在机器学习和自然语言处理等领域是用来在一系列文档中发现抽象主题的一种统计模型。直观来讲,如果一篇文章有一个中心思想,那么一些特定词语会更频繁的出现。比方说,如果一篇文章是在讲狗的,那“狗”和“骨头”等词出现的频率会高些。如果一篇文章是在讲猫的,那“猫”和“鱼”等词出现的频率会高些。而有些词例如“这个”、“和”大概在两篇文章中出现的频率会大致相等。但真实的情况是,一篇文章通常包含多种主题,而且每个主题所占比例各不相同。因此,如果一篇文章10%和猫有关,90%和狗有关,那么和狗相关的关键字出现的次数大概会是和猫相关的关键字出现次数的9倍。一个主题模型试图用数学框架来体现文档的这种特点。主题模型自动分析每个文档,统计文档内的词语,根据统计的信息来断定当前文档含有哪些主题,以及每个主题所占的比例各为多少。

控制论技术

控制论是一门跨学科研究, 它用于研究控制系统的结构,局限和发展。在21世纪,控制论的定义变得更加宽泛,主要用于指代“对任何使用科学技术的系统的控制”。由于这一定义过于宽泛,许多相关人士不再使用“控制论”一词。 控制论与对系统的研究有关,如自动化系统、物理系统、生物系统、认知系统、以及社会系统等等。

信息论技术

信息论是在信息可以量度的基础上,研究有效地和可靠地传递信息的科学,它涉及信息量度、信息特性、信息传输速率、信道容量、干扰对信息传输的影响等方面的知识。通常把上述范围的信息论称为狭义的信息论,又因为它的创始人是香农,故又称为香农信息论。

推荐文章
暂无评论
暂无评论~