「主算法」即将改变我们的生活

我们可以这样说,大多数人都不会花太多时间去思考算法。我们点开亚马逊会发现根据我们的购买记录所生成的推荐商品。我们可以看到Netflix根据我们的喜好精心挑选电影。但是我们并不需要考虑这意味着什么或是这背后运行的机制。无论是Facebook的一个错误,华尔街的暴跌或是网上商店出售的由电脑生成的毫无品味的T恤,大概只有当算法乱套的时候我们才会想起它。  

只有在这些时候我们才会想起,这个世界的运行是多么地依赖算法:它们是一些越来越复杂和难以理解的规则,统治着我们身边的所有计算机。当算法变坏时(参考天网),我们才意识到自己是多么的脆弱;我们意识到,他们的错误不是人为的,当然了,因为算法不是人。Pedro Domingos已经潜心研究算法许久。他的新书《主算法(The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World)》是对那个领域的介绍——同时也是对最先进的技术的报告。他相信我们生活在一个算法的时代。并且,他认为我们也许能看到算法彻底重塑我们的世界的那一天——甚至比今天已经做到的更多。review-the-master-algorithm-pedro-domingos-allen-lane我和他通过邮件讨论了人类和计算机之间「思考」和学习的差别,算法已经在多大程度上影响了我们的生活,以及当机器最终学会如何学习时将会发生什么。您说我们生活在一个算法时代。可是,为什么我们却感觉不到每天有如此多的算法在为我们工作,或是给我们捣乱呢?机器学习是如何在幕后悄悄工作,而不被我们注意到呢?计算机所做的每一件事都使用到了算法。你的手机、电脑、汽车、房子和家用电器都是基于算法。但是它们却是隐蔽的:你看见一个闪光的小装置,但是却不知道里面的运行机制。Siri用算法来理解你说的话,Yelp用算法来帮你选择餐馆,车子内的GPS系统用算法来帮你选择最佳路线,刷卡机用算法来帮你支付。公司用算法来选择职位申请者,共同基金使用它们来交易股票,国家安全局用它们来标记可疑电话。  

「常规」算法和学习算法的不同是前者必须由软件工程师来人为编程,一步一步地解释计算机需要做的事情。而后者则是由计算机自己通过观察数据来决定它们需要怎么做:这是输入数据,那是想要的输出,我该怎么实现中间的转化?引人注目的是,同样的学习算法能学习做无数不同的事情——从下国际象棋到医学诊断——只需要给它们合适的数据即可。书名中的「主算法(master algorithm)」是什么?它与Ray Kurzweil的奇点有何不同?它有哪些潜在的优势呢?主算法是一种能够从数据中学习任何东西的算法。如果给它关于星球运动、斜面和钟摆的数据,它能发现牛顿定律。如果给它关于DNA的晶体图像数据,它能发现双螺旋结构。从你手机里所有的数据,它能学习预知你接下来会做什么并想办法帮助你。也许从大量的癌症病人的病历数据中它甚至能找到一个治疗癌症的办法。  

它能带来的其他好处还有:家庭机器人、一个能回答你问题的万维脑(World Wide Web)而不仅是一个只能呈现网页的万维网;一个了解你和你最好的朋友的360度推荐系统,不仅仅推荐书籍和电影,还有约会、工作、住房和假期——你生活中的任何事情。  

Kurzweil的奇点是人工智能超越地球人的一个点,因此变得无法理解。或者更确切的说是奇点的「视界」,就像任何光都无法逃脱的黑洞视界一样。如果没有主算法,我们就无法很快到达奇点。如果有了主算法,人工智能的发展必然会加速,但我认为我们依然能够理解这个世界,因为人工智能将会设计来为人类服务。我们也许不会理解它们是如何生产出它们给予我们的东西,但是我们能够理解这些产品能为我们做些什么,否则我们也不会想要它们。除此之外,这个世界总有一些部分已经超出我们的理解范畴。不同的是,现在它的一部分是由我们设计的,这无疑是一个改善。您在形容这个领域时,将其划分为多个「部落」,每一个都有一个不同的机器学习方法,它们在某些特定问题上的表现比其他方法更好,但是没有一个部落拥有可以包罗万象的算法——也就是一个可以回答所有可回答问题的机器学习程序。您将主算法与粒子物理学标准模型或分子生物学中心法则相比较:「它是一个统一的理论,能理解我们迄今为止所知的一切,并为今后几十年甚至几十年的发展奠定了基础。」这听起来口气很大。为什么主算法看起来可行?又是什么在阻止着分离的部落们来创造它呢?就算是一些最简单的学习算法也有数学上的证据,证明它们能从足够多的数据中学习。因此从这个层面上说,主算法无疑是存在的。实际上,每个部落中都有一些研究者们相信他们已经找到它了。但问题是算法要能够利用实际的数据和计算来学习你想要它做的事情。这里让我们转向经验证据:自然为我们提供了至少两个能学习(几乎)任何事物的算法例子,即进化和大脑。因此我们知道主算法是存在的。问题在于我们是否能够准确完整地把它弄清楚并写下来,就像物理学家将物理定律用公式写出来一样(公式本身也是一种算法)。  

不幸的是,五个机器学习的部落像盲人摸象一般:一个摸到了象鼻认为是一条蛇,一个倚靠着象腿认为是一棵树,另一个摸到了象牙以为是一头牛。我们真正需要做的是退后一步来看整体,看看各个部分是如何契合在一起的。讽刺的是,这对那些不会沿着5个部落铺好的道路去思考的外行反而会更容易一些。打开您的书,有一句来自Alfred North Whitehead的引文:「文明的进步是靠增加那些不需思考就能完成的重要操作来实现的。」无论我们赞不赞同这个笼统的观点,它似乎唤醒了一些与「思考」的概念有关的重要事情,并且关系到文明与人性。我们倾向于认为「思考」是人类独有的活动,甚至是决定性的一个活动。一些人(如Nicholas Carr)告诫人们不要将我们的思考外包,他认为这会减少人性——担忧缺少思考会让我们变得更像广义上的机器人。与此同时,我们也很担心「思考」机器:你提到Skynet等毁灭性的人工智能依然只是人类虚构的产物。我们是否应该认为计算机已经具备了「思考」的能力?还是说,思考只是人类所特有的活动?——如果是这样,人类思考者与未来的机器学习者之间的分界线该如何划分呢?著名计算机科学家Edsger Dijkstra说计算机是否能思考的问题和潜艇是否能游泳同样重要。先把定义放到一边,重要的是计算机能解决人类通过思考所解决的问题——并且这些问题的范围还在扩大。借助机器学习,计算机甚至能解决我们不知道如何通过编程来解决的问题——它们自己会找出解决方法。所以划分的界线非常模糊,并且一直在移动之中。  

我不同意Nicholas Carr关于「外包部分思考会消灭我们」的观点——恰恰相反,这反而会使我们受益,它让我们集中精力在更好的事情上。我想,这是Whitehead的观点。苏格拉底不喜欢书写,因为这会让人们忘记事情。于他而言,幸运的是柏拉图替他记下了他的想法,正因如此人类到今天都还记得他。书写加强我们的记忆,Google更是如此。它绝不会让我们变得愚蠢,相反,它会让我们更加聪明。书的结尾您写到:「人们担心计算机会变得太聪明,将来会统治世界,可是实际问题是,它们太愚蠢却已经统治了世界。」您能对这一点再补充解释一些吗?像Stephen Hawking和Elon Musk这样的杰出人士已经拉起人工智能的警报,声称它是会威胁到人类的生存。 但是邪恶AI统治世界的「天网情境」有点过于牵强了。我认识的AI专家大都不把这当回事。它的问题是在于,人们混淆了智能与人的概念。在好莱坞的电影中,人工智能和机器人总是伪装成人类,但是现实中它们是完全不同的。计算机没有自己的意志、情感或意识。它们只是我们的延伸。只要它们做的工作是我们设定的,我们设置了边界并检查方案,计算机就能够永远智能而无害。 这并不意味着我们可以高枕无忧。和其他所有技术一样,人类可能会用AI来实现一些不好的目的。但更多的情况可能是,AI会给予我们嘴上要求而非内心真正想要的东西,从而造成伤害:这是一个魔法师学徒问题。在今天的世界,计算机已经能进行所有重要的决策——谁得到工作,谁得到信用卡,谁被标为潜在恐怖分子。它们也经常犯错误,因为它们没有最基本的常识。解决的办法是让它们变得更聪明,而不是更愚蠢。所以我们应该担心的不是人工智能太多,而是太少。在机器学习的过程中,我们应该注意的最重要的事情是哪些?我们每个人应该控制我们身边的机器学习算法。否则它们将为建立它们的组织服务,而不是我们。就像开车一样:你需要知道哪个是方向盘和哪个是踏板,怎么去操作它们。如果一个出租车司机跟你说:「我觉得我知道你想去哪里。」你大概会匆忙逃出来。但这就是现在学习算法正在做的事。它们有控制旋钮,但是被隐藏起来了。  

你应该能,比如说,告诉亚马逊的推荐系统你想要它为你做些什么,要它去修正它的选择,解释它哪些方面做错了等等。机器学习变得越广泛,它就越重要。我不想委屈您来做一个可证伪的预测,但是:为了创造主算法,我们需要做哪些改进呢?许多人认为我们已经拥有创造主算法所需的主要思想了;剩下的事情只是如何去综合它们。在这个方向我们也确实取得了很大的进步;事实上我们离成功已经不远了。但是我感觉我们仍然缺失了一些重要思想,需要有人来研究。我手上已经在操作一些候选者,但我毕竟只是一个人。所以我写这本书的目标之一是开拓所有人的眼界。我的秘密愿望就是,某处的一个孩子——未来AI领域的牛顿——能够读到这本书,开始思考与机器学习有感的事情,并产生众望所归的灵感。  

来自kernelmag,作者Jesse Hicks,机器之心编译出品。参与:钟靓,汪汪。

入门算法
返回顶部