这位「计算」的信徒,要用机器智能塑造城市的未来 | 人物对话


搜索王坚,几个关键词出现频率很高——不懂技术、大忽悠、疯子、先知……

很多人在讨论他,从当年那些饱受争议的细节贴片里「揭秘」这位「阿里云先生」的功过是非。

连他自己也曾在给全体员工颁发阿里云「飞天奖」时说,「坚持就是伟大」,颇为悲壮。

这话说来贴切,熬过最艰难的两年时间,拥有机会窗口的阿里云开始进入快车道。在阿里云正式对外开放的两年后,阿里巴巴招股书里提到,2013 财年云计算收入超过 6.5 亿元人民币,截至 2013 年底,已经有 98 万客户使用阿里云计算平台。同年,阿里云开启全球化步伐。到了 2017 年,营收数字突破 100 亿元。

阿里云也一直踩在互联网行业的机会点上。云计算让阿里巴巴在技术布局上有了坚硬基础,两年前开始的「城市大脑」计划则进了首批国家人工智能开放创新平台名单手握官方「船票」。

城市大脑已经和杭州、苏州、吉隆坡、上海等城市合作起来,它被认为是阿里云产业 AI 革命的动力,王坚将它类比登月计划。他也不止一次说明自己对这件事的着迷和重视:

「城市可能是人类有史以来发明的最大智能硬件,这么复杂的智能问题放在我们面前时,就很难用传统意义上的人工智能来描述了。」

这背后实际上是计算的重要性持续凸显,无论是互联网还是谈人工智能,越来越需要利用高效计算在云和端之间对资源进行合理分配。对王坚而言,所有的「先知」、「预言」,都来源于他对「计算(computing)」本身的坚定相信。

我们在约见的云栖科技博悟馆里,看到了名为《2050 年的杭州》的装置展示:一朵「云」下面是 2050 年杭州的城市面貌。这是王坚对机器智能塑造未来城市的积极想象,「水、电、道路,所有的公共资源只需现在的十分之一,建筑不像现在这样越长越高,而是越来越矮。」

我们问到如果你来回答「王坚是一个什么样的人」,会想说点什么?

王坚提到了——乐观和在任何环境变化中都能不断找到新乐趣。

「计算」,始终是一切新乐趣的支点。

以下为机器之能对王坚的专访实录,编辑做了不改变原意的删减。

我知道计算的重要性,这一点确实比别人坚决一点。

很多讨论大部分围绕你对阿里云的预判与坚持,也有人给你贴先知的标签,很好奇你是怎么做决策的?

有几个因素交织在一起的,撇开我个人因素,大家对阿里做云计算也有很多不同看法,甚至认为阿里不是做这种事情的公司。也有对中国有不同看法的因素,10 年前中国一家公司突然要做一个技术平台,并把技术平台做成商业,对大家来说,都是挑战。当时中国第一次开所谓的大规模云计算大会,唱主角的都是传统 IT 公司。阿里云那时候都还没有太多收入,中国随便找一家软件公司的收入都比阿里云大。所以我也觉得大家有这样那样的看法,是很容易想象和接受的事情。

至于是不是先知,是另外一件事情,我知道计算的重要性,这一点确实比别人更坚决一点。至今对我来说,没有 GPU、CPU 的区分,归根到底是计算对社会进步的重要性。

过去我们会讲计算机的重要性,把屏幕、键盘和鼠标这些都包括进来。但慢慢地你就发现这里面核心是在计算上,现在开始强调计算的重要性,这是认知上巨大的进步。看我的《在线》一书就会知道,我对云计算有自己的理解,我是坚信计算对未来发展的重要性。

回过头看,你觉得有哪些你认为的对或错的决定?你有为做一个决定而为难的时候吗?

其实是没有,我觉得很大的因素是直觉决定的。对我来讲,难的不是有了几个不同的选择,如何做决定,难的是坚持了一些直觉。困难不是做决定,而是有一个方向之后,不要被周围嘈杂的声音带偏了方向。

举个最简单的例子,对我来讲计算这件事情是几乎没有改变过的,这不见得是我的一个决定,却是非常重要的直觉和判断。当时确实有人认为做网盘就是云计算,可能今天很多人还是这么认为。做网盘可能是当时最容易看到所谓变现和商业场景的应用,公司内部也有这样的声音。从需求角度也没错,当时的确很多业务需要图片存储能力,但这些对我来说就是会带偏方向的「噪音」。

2008 年,我们刚开始做的时候,今天大多数流行的开源平台都没有出生,也没有特别可以借鉴的,所以要不要做我们称为「飞天」的自己的技术平台?这是非常大的决定。今天很难有人体会那个决定有多大,实事求是说,这个决定可以把一家公司搞垮。这也是我觉得责任重大的地方。现在看来,这个决定是对的,变成了我们的核心竞争力。今天都说自己有云计算平台,但我可以自豪地说我们有「飞天」。

类似的事情有很多,说一件阿里云发展历史上最有意思的一件事情,阿里云的网站是在公司成立两年以后上线的,一般互联网公司都是公司成立的同时就有网站了。阿里云也可能是中国互联网圈里唯一一家成立时没有网站的公司。

有一次我说大家认为我们是皮包公司,因为你是互联网公司,那你怎么连网站都没有?其实大家不明白我们的网站就是我们的产品,我们用了两年时间开发了最初的阿里云产品。这也是为什么阿里云成立时没有上线网站,因为它是特殊的。我们因此跳过了传统 IT 公司对云计算产品的认识,从这个角度来说,这也是一个非常困难的决定。

你刚刚说,最难的是坚持,那么很多决定也是你自己在跟自己较劲的过程吧。

其实我也没有那么痛苦去做一个决定,我甚至都没有说排个方案出来,应该是直觉吧。但是坚持按照直觉做下去,这还是有它的难度。 

云计算技术平台这样一件大事,可能很多人的想象是,你要先说服马总或董事会,你是如何促成这些人做出一个明确的表态?

一个真正有意思的事情不可能是大家讨论出来的,大家讨论的是怎么帮助你,支持你,但做不做不是大家讨论出来的,这是我长期以来的观点。我在阿里没有定过 KPI,也没有写过商业计划书,结果一个朋友跟我说,这是因为你的业务在公司不重要(笑),所以这件事大家也是仁者见仁智者见智。但是不管别人怎么看,我能看到马总对这件事的坚定,所以我觉得任何有关创新的决定并不是一个逻辑上可以推理证明的事情。

所以那时候你们两个人对做技术布局是有默契的,可以这么说吗?

这个啊……一总结这个味道反而不太容易表达出来。我觉得马总是对技术有向往的人,这样讲更加确切一点。他对技术的向往甚至超过很多做技术的人,很多做技术的人可能觉得它只是技术而已。向往可能是最好的状态,甚至比理想都要好,理想还要想着去实现,多少还带有一定程度的功利,我是这么看的。所以我觉得「向往」是非常了不起的事情。我有时候说,做技术的人也是太现实了,就是这个原因。

从行业来说我没有危机感,但是从能力角度来说是一个很大的危机感,你有没有能力满足不断增长的计算需求。

现在阿里云的营收状况、国内市场占比情况都不错,你觉得需要有危机感吗,或者现在有吗?

从大的方面来看,我最早做阿里云的时候就说我们要做通用计算,从计算需求角度来说,我们今天还只是开始的开始的开始。从大型机、小型机到个人电脑、手机,计算装置形态的变化很快,可能一、二十年就变一次。但是对计算需求的不断增长是很长久的。实际上,云计算就是满足人民日益增长的对计算的需求。计算的需求会长时间的存在,并且高速增长,可以用 100 年这个尺度来讨论。把今天所有的计算市场份额加起来,也可能只是 20 年以后的千分之一的市场。

这点跟一般的日常消费不一样,人再厉害,不能一天吃 100 斤龙虾,总能看到上限。但大家对计算的需求是没有上限的。人工智能出来以后,带出新的计算需求。由比特币带来的挖矿搞得显卡供不应求。先不说比特币本身有没有道理,但这一现象反映的也是计算上的需求。所以,从行业来说我没有危机感,但是从能力角度来说是一个很大的危机感,你有没有能力满不断增长的计算需求,这是对技术和商业能力的综合考验。

你之前说过云计算国际化,其实是倒逼一个企业具备全球服务能力,而不是说今天把这个东西卖到哪个市场上这种传统企业的逻辑。那我想听听你说一下阿里云的全球服务能力,主要体现在哪些方面?

为什么要有全球服务能力?不是你搞了一个办事处,你就是全球的了,是因为你的客户是全球跑的,你的服务能不能到那里。过去你卖一个产品可以说我不卖,但今天你说了不算数,因为你的客户在那里。我觉得这是非常大的变化,云计算也是倒逼我们有这么一次变化。

阿里云做的很多事情就说明了这个问题,一,比如要做云计算服务,当然要有全球的基础设施。在各大洲建数据中心,也是因为需要全球的基础设施。没有金刚钻不要揽瓷器活,是吧?二,产品要能满足,今后我们的产品在不同的国家都是同步上线的,这是非常大的改变,我们要从这些细节上慢慢体现出来。

阿里云是从什么时候开始真正重视人工智能的?

就我个人而言,读大学的时候就接触人工智能了。实际上要用今天的 AI 标准的话,我觉得阿里云成立的第一天我就开始做这件事了。阿里云以前也做过输入法,做输入法的目的不是为了做输入法,是为了做自然语言处理。如果从这个角度,用我们今天比较流行的话说,我们第一天就是 AI 公司。

但这么说没有意义,如果讲真正意义上对智能技术领域关注,是 2014 年成立 iDST(Institute of Data Science & Technologies),这对我来说是蛮有标志性的,最早招的几个人包括金榕、漆远都是公司在这方面的骨干。iDST 这个名字也反映了我们的思考,以前我读大学时的 AI 实际上是探讨逻辑跟智能的关系,现在我们关心数据跟智能技术的关系。

也是这段时间的工作,让我开始理解,所有机器能做的事情,都不应该人去做的,机器会把人解放出来。所以我现在会很强调机器智能这个概念。

现在看来,阿里向外输出 AI 能力的主要渠道在云平台上面,那如何理解 AI 跟云的关系?

三个词我觉得要分开,一个是云,一个是云计算,另一个叫 AI 也好,或者叫 MI(Machine Intelligence)也好。阿里云本身就是一个巨大的计算平台,它是云计算的基础,在阿里云上的应用可以叫做云。阿里云自身做最基本的东西。我一直觉得对阿里云而言,计算重要,云是不重要,阿里云计算就是要让客户的云无所不在。为什么说以前大家觉得网盘就是云计算,根据我的理解,网盘的应用实际上就是云计算上的应用而已,是一个很重要的云计算应用,但是它不是基础的云计算服务。

那么,到今天为止,云应用跟传统应用之间的差别是什么,是机器智能或者说 AI 慢慢变成了这些云应用的很重要的不可分割的一部分。今天 AI 那么热是有道理的,就是慢慢地,各种基于云的业务里面都少不了 AI 这个成分,就是这么一个关系。AI 创造了新的计算需求。

传统上,你没有办法离开一个机器来讨论一个应用,软件它最后还是要找台机器,找不到机器这个软件你就不知道放哪里,你说 Offic 软件如果没有台机器,你哪里找到 Office?今天,你没有办法离开云计算谈 AI,这个关系是一样的。

对阿里来说,AI 的研究和应用重点体现在哪些方面,边界会是什么?

我无法提供一个简单的答案,比如百度讲 All in AI,腾讯讲 AI in all,那阿里应该说句什么话才能匹配?我觉得还要从不同的角度来看待这个事情。

回到阿里最早的初心,我觉得阿里对 AI 最重要的体现就是将数据作为了一个起点。同时阿里是有自己的体系的,也达成了重要的共识。比如机器智能,从这个角度来看,阿里没有 AI 的研究,只有 MI 的研究。

我经常举一个例子,我一个朋友,他说:我本来是做视觉的,现在有人告诉我你是做 AI 的,他直接傻掉了。以前自然语言处理是一个专业,但今天很多人说你不是做自然语言处理,你是做 AI 的。就相当于,你做了一台 PC,但有人告诉你,你是在做一台 AI 机器,照这么下去的话,明明是电动推子给你理的发,大家却说是 AI 在剃头。所以,我觉得阿里在坚持做一个很重要的事情,就是将数据作为起点,在做机器的智能。

另外,我们坚定地相信智能技术是重要的,我认为,智能技术比计算更高一层,至少从两方面可以反映出来。

第一,在今天,智能技术非常重要,跟其他任何技术相比,都不在一个层次上,智能技术是它们的提升。像阿里做电商,以后也要基于智能技术,从这个角度说,我们不但要 all in AI,也要 AI in all,对我们来说,这是自然而然的事情。

第二,AI 真正创新的未来是什么?大多数人觉得中国的强项是在 AI 上的应用,我不同意这个观点。我认为,中国长远的价值一定不在 AI 上的应用,这是为什么我要做城市大脑的原因。城市大脑破了一个东西,它可以看到过去传统意义上的 AI 根本没有触达到的问题,我觉得这是它的价值。

城市大脑对我们重要的地方在于,我们看到了一个新的问题,这个问题是来挑战、或者推动整个智能技术的发展。这个时候,谁离问题近,谁就在创造新的东西。如果今天的方法可以解决城市大脑想要解决的问题,那我今天也不会花时间做这件事情,所以我觉得在阿里至少这两方面是我们可以看得到的。当时科技部要把城市大脑列进去,我还有点犹豫,但是今天看来是件好事。

为什么犹豫?

我当时犹豫,是因为如果大家觉得城市大脑只是 AI 的一个大应用,那就亏大了,因为过两年大家都不谈 AI 了(笑)。但是现在命名为「城市大脑国家人工智能开放创新平台」,我觉得挺好的,城市大脑的确为人工智能提供了重要的开放创新平台,智能技术也确实是城市大脑非常重要的一部分。

世界上最遥远的距离是摄像头与红绿灯,它们在同一根杆上,但从来没有通过数据被连接过。

宣布城市大脑项目的时候,其实也不是完全准备好的一个状态,是吗?

对,肯定是没有准备好的,某种意义上说,AI 到今天都没有准备好。因为这相当于一个新的东西。

你说的是说技术没有准备好,还是解决方案?

所有的东西都没有准备好。从理论到实践,到大家心理的准备,都没有准备好。我已经很难想象什么叫没有准备好,只能说就是没有准备好。

所以这又是一个凭着直觉的决定?

对,这不是一个靠讨论讨论就能做出的决定。

但是你最早得跟杭州政府谈拢啊。

是没谈就拢了。要谈的事情都是谈不拢的,谈得拢的事情都是不要谈的。

如果你认真去分析当时的线索,起因是跟交通有关。我的直觉表明,交通不是现在的方法可以解决的,现在任何名词的堆积都解决不了交通问题,包括 AI 这个词。所以我认为,应该有一个新的机制来做这件事情,但机制是什么,当时没有完全想清楚,我只是用了一个词——「城市数据大脑」。为什么把数据放在里面,是因为数据是其中最关键的部分,那为什么缩写就写成「城市大脑」,因为城市大脑就是一个新的机制。没有城市大脑,数据失去了物质基础,没有数据,城市大脑便没有生命力。但这个东西到底是什么?到今天为止,我都还在定义城市大脑,甚至我自己想成立研究所专门研究它。

尽管我最早提出城市大脑,但是第一次决定做城市大脑的是杭州市,这非常了不起。阿里云牵头组织相关企业帮助杭州市在做这件事,这也非常了不起,因为那时需要有企业愿意帮一个城市做这样的创新。

但当时有一些「噪音」,比如能否叫城市决策支持系统这样的名字,我当时坚持不能叫这样的名字。

 大部分人都认为城市大脑是解决交通问题,但这是有差别的,因为解决交通问题是大家都可以接受的,但叫城市大脑是对现有城市问题的重新思考,大家是否接受是要担风险的。城市大脑就是机器智能中的阿波罗登月计划,能把一大批想象不到的技术带出来,生命力会很强。

杭州后来成立了一个领导小组,就用了「杭州城市数据大脑」这个名字。这个词第一次出现在正式的文件中时,在学术界都没有出现过。我觉得这是一个历史性的里程碑。

如果说做这样的决定也是依靠直觉,那直觉是什么时候有的?

我觉得直觉还是要有积累的。为了做云计算,我跑过中国多少城市?没有几个省市是我没有跑过的,一年内,宁夏去五六次,贵州跑五六次,这样的人也不多。我不是去玩,而是去了解每个城市如何做信息化建设的。没有这些积累,也没有可能有这个直觉。

我为什么反对叫决策支持系统,为什么说城市大脑不是传统的信息化建设,甚至为什么我不说打通数据孤岛。直到今天,大家讲大数据应用,第一条还是打通数据孤岛,现在看来这种说法都有些胡扯。所有人都在说,打通数据孤岛后,做信息化建设。但我认为这是想把手指头和脚趾头连在一起,让手指头和脚趾头协调工作,这是不可能的。手指头和脚趾头能协调工作是因为靠大脑,它不是靠绑在一起。不要认为这是一个简单的道理,但今天我们几乎所有想做的事情,都是想把手指头和脚趾头接在一起,很多 AI 还想把手指头跟脚趾头做得更聪明,那更加做不到一起。

做了这么长时间的智慧城市,你会发现这是没有大脑的智慧城市。所有做的事情,还是想把手指头跟脚趾头连在一起。这一点我体会很深,当你跑过所有的地方你就知道有这个问题。

这些协调一定要靠机制,比如,智力的分配,多少智力分配在手上,多少智力分配在脑上,要有一个自然的机制。城市基础设施的建设,智力的分配是有一套方法的。所以城市大脑实际上是在改变这样的事情。

在这些城市的调研,最核心的具体痛点有哪些?

世界上最遥远的距离是摄像头与红绿灯,它们在同一根杆上,但从来没有通过数据被连接过,摄像头看到的东西没有变成红绿灯的行动。就像手指头与脚趾头,没有一个大脑,它们是连不起来的。我觉得,做 IT 技术的不要把落后生产力带给别人,有再高明的技术,把手指头跟脚指头连在一起,那也是落后的生产力。但今天几乎所有传统信息化建设都在干这样的事情。

实际上,中国社会已经基本完成了一个数字化过程,或者计算机化的过程,打下了很好的物质基础,但还谈不上协调。这个协调不是靠手指头和脚趾头,而是靠大脑,这是我们真正面临的深层次的挑战。如果只要 AI,但没有城市大脑这样的架构,那所有的 AI 也就只能帮助怎么把脚指头跟手指头连在一起。

这个项目对团队比较大的考验是什么?因为最近在海外马来西亚城市大脑的项目,说要培养 300 位数据科学家,可能还会产生相关联的公司有 1000 多家左右,我觉得这个听起来是特别重的事情。

我觉得,慢慢发展下去这个数字一定会更大。但具体到场景,是不是这个数字,我也不好说,因为我不具体负责。但有一点可以肯定,会有越来越多的人围绕城市大脑做事。在阿里,有一个部门在做城市大脑,所以这不只是一个项目。而跟我们合作的公司里,也开始有城市大脑部门,大家接受度这么高,超乎我的想象。

做城市大脑这样类型的事情,对于这些以前埋头做研究的人来说,是不是还是一个比较艰难的调整过程?他们可能需要做一些做事方式上的转变,比如现在要泡在公安局或者厂房。

对,我觉得是一个很大的挑战。他们至少要完成三级跳。比如做视频的,对于他们来说,他们就是做视频处理的,只不过用了跟 AI 比较像的方法论,这是他们的起点,也是他们的阵地。这是第一跳。

但这个社会需要新的机器智能的引擎,所以他要从视频的处理变成引擎,这点非常重要。有了这个引擎,才能把视频处理这些技术变成动力,就像电跟马达的关系。这是第二跳。

引擎再上一层才是真正的城市大脑,这是第三跳。

我的理解,对于大部分 iDST 的研究人员来说,本来都还停留在视频处理的阵地,但正在被城市大脑的巨大场景带着完成这三级跳。

另外,能不能提出好的问题是一个最大的挑战。今天大部分的人工智能问题,也许是一辈子都解决不了,也有可能人类永远解决不了的,从这个角度来说,是很难的。但从另外的角度来看,也是很浅薄的,例如凭借常识提出希望机器能听懂人的话、认出人的脸这样的问题。

但城市大脑,离人的经验太远,想提出问题都极其需要专业知识。这对他们来说,也是挑战和困难的问题。对于交警来讲,反而更知道解决交通这个问题的难度,虽然他不知道你如何解决这个问题,但是他理解这个事情,他知道难的地方。所以我觉得大部分的问题是提了一个难解决的问题,但不见得是一个难提出来的问题。为什么阿波罗登月计划了不起?其实是因为它突然会让大家提很多你坐在地上提不出来的问题。

华先胜老师好像在城市大脑上付出的时间会多一些是吗? 

对,他其实是从淘宝转到 iDST,但他不是最早进入城市大脑的。最早进入城市大脑的都是阿里云原来做智能交通的那批同学,因为一说交通自然而然就是互联网+信号灯之类的。但他们很痛苦,痛苦到很多人都不愿意见我。我也很郁闷,因为他们没有触及到城市大脑真正的问题,这是一个新的事情。城市大脑涉及到视频,从这个角度来看,华先胜是最容易切入的,他现在对城市大脑的认识深刻度也是足够的。这个变化我觉得还是蛮大的。

其实我都没有时间去想这两年的变化,这不是一般的变化。这两年对城市大脑认识的飞跃,一定会超过了这两年大家对 AI 认识的飞跃。

你之前一直说城市大脑不仅仅是一个人工智能应用,类比登月计划,这个巨大的场景是可以倒逼出很多的技术进步和创新,那目前来说它做了哪些重要的创新? 

我们一点点来分析。第一,城市大脑涉及规模化的视频。说得极端一点,以前我们的视频(技术)只需要处理一个车牌号,大家都知道是用来罚款的,但突然发现,通过视频还可以知道车有没有刮蹭,这是一个巨大的进步。因为车牌号是明确的可以描述的场景,但刮蹭很难描述。除了刮蹭之外,我们还可以从视频里知道这个地方堵没堵,这就从一个确定的问题变成一个非常不确定的问题,更是一个巨大的进步。

第二,原来做车牌识别,只需要一点计算能力,但你要去识别有没有剐蹭,计算能力可能就要增加 1000 倍。1000 倍是什么概念,如果你今天做一件事情需要一年,你会好好计划。但如果这件事情要多花你 1000 倍的时间,你有生之年都干不完,可能就压根儿不会开始了。

你再往下想,以前大家说不清楚大数据是什么,但你突然发现城市多了一个新的东西,那就是数据资源。当认识到视频是城市重要的数据资源的时候,你会发现视频就不仅仅是视频了。

从本身的视频处理技术的发展,到计算能力的提升,再从大数据到数据资源,最后城市大脑就变成了城市的基础设施,管理着所有的其他基础设施。

从这几个层面来看,每个层面都值得做很深的研究。比如视频处理,本身对机器学习或者窄义的人工智能就是挑战。1000 倍的计算量,对计算能力也是个挑战。大家本来讲的是大数据,但你突然发现你手里有个东西叫数据资源,这是巨大的进步。

再往下想,你会觉得这是非常大的变化,越到上面去看,越会影响所有的事情。设想一下,没有巨大的计算能力,你不可能把这个场景找出来,再往上看,数据资源远远不只是视频资源。然后你会理解,城市为什么会是人类最了不起的发明,会是最大的智能硬件。

所以从这个角度说,跟以前相比,人工智能跳出非常大的一步,这就是为什么人工智能值得热一热的地方。从识别圆锥体到下棋,再到解决真实的问题,比如识别车牌,这些都是进步,但这些还都是局部问题。到了城市大脑,你就会发现有一个那么大的对象-城市,要整体去理解它,我觉得这是巨大的飞跃。

如果一定要做个比喻的话,我觉得城市大脑给机器智能或者人工智能带来最大的影响,就像阿波罗登月计划。在登月计划以前,不管你在地球上如何折腾,都不需要摆脱地心引力。但你要登月,就需要有一个东西来摆脱地心引力,这是一次质的变化。

做城市大脑会是一个什么量级的投入?以前看它应该是阿里云孵化出来的一个项目,但是现在听起来它是一个挺大的事儿。

根据我的理解,以后世界上主要的计算都是因为这个而完成的,不只是阿里云,所有云计算服务的对象也都是它。可以说,城市大脑用掉的计算量,会是世界计算消耗量的最主要部分。所以我觉得非常值得从各个角度去研究。另外,尽管这不仅是一个人工智能的应用,但它是借着人工智能的热度做起来的,所以要感谢人工智能。

听说也有越来越多的公司成立城市大脑这个部门,所以从这个角度讲这也是超出我的想象的。但回过头来讲最大的挑战是什么?我觉得最大的挑战就是我今天已经没有办法具体到一个或几个技术上,我觉得这件事情到今天为止最大的挑战是,能不能真的把它变成城市的基础设施。智慧城市有一个最大的问题,到今天为止它还是一个项目,那项目这件事情建完就建完了。但是像地铁就不是个项目,它就是会持续下去的,直到这个基础设施被淘汰。

对阿里云和社会来说,这都是最大的挑战。用他们搞城市规划的来讲,城市大脑是一个城市的另外一个图层。就像我们下面有地下管网的下水道,完了铺电缆,铺水管网,那么城市大脑就是在上面的一层。而这一层跟其他还不一样的地方,这一层跟所有层都有关系,它本质是在优化城市所有公共资源的使用。所以我觉得城市大脑无论是对阿里云,还是对社会,最大的挑战就在于能不能变成基础设施,能不能真的做到这个终极目标。

或者能这么理解吗,这是阿里云下一个重要阶段?

至少我是这么认为的,不只是阿里云,亚马逊也是这样。其实今天的云计算,在我的理解,过去不在云上完成的东西给搬到云上来了,是计算效率极大的提高,很了不起。但并没有创造出新的计算需求,而城市大脑创造了新的计算需求,这个需求可能是原来的 1000 倍,它代表了质的变化。

这个过程中,你体验过哪些艰难时刻?

有人说城市大脑跟当时做阿里云很像,其实也谈不上艰难,就是 99% 的人都不相信这个事情,但只要有一个人相信,你就去做好了,不用在乎还有 99 个人是不是相信。为什么说我的运气呢,是因为不管你信不信我们都干下去了。

而中间具体事情(坎)就太多了,在某一个时刻只要有一个人没扛住,那可能整个事情都扛不住了,这种情况出现的太多了。 

所以就是因为你一直在扛着,这个事情一直能继续。

不是说我,我是说有一个人,可能中间干活的任何一个人,他稍微出点岔子,这件事情可能就没有了,这个人可能是阿里云的一个员工,也可能是一个交警,真的是有很多这样的地方。我们运气好的地方,真的像一个接力棒一样,一棒一棒接下去了,这个还真是蛮运气的。

但是你想,接力赛跑,你想交棒,那就会有掉棒的,特别是快速奔跑的时候,所以要保证一棒棒交下去。所以但凡有意义的事情,早期的人都很痛苦,恨不得脱离,到今天为止很多在做的也觉得这是个苦海无边的事情。反正我觉得大部分今天对 AI 热衷的人碰到城市大脑都会苦海无边,很想跑掉。

现在经手城市大脑项目的主要部门,是独立项目团队还是调用阿里云的人?

城市大脑是阿里的一个重要业务,iDST 是阿里非常重要的技术部门。城市大脑不是阿里一家可以完成的,是不同企业在整个产业上的创新,同时还要协调城市各个部门。更重要的是,城市大脑是杭州市的城市大脑,不是阿里的,阿里只是帮杭州市做城市大脑而已。

城市大脑最核心的地方,是像电一样,电网建好很重要,但最后电在里面跑更重要。所以杭州城市大脑,从第一天就能够跑杭州市的数据,可能这是最了不起的事情。

就像修路一样,车如何在路上跑起来,可能比路更重要。因为没有车的话,就会变成鬼城。所以没有城市的数据,这个大脑也就是鬼城。

所以我们很运气的地方在于,杭州市没有一开始将它变成鬼城,从这个角度说,杭州做了巨大的创新,创新的幅度不小于我们最初提出城市大脑。这也是杭州市成立数据资源局了不起的地方,今天大部分企业都没有这个概念,甚至做 AI 的人都没有建立数据资源的概念。

城市大脑里面哪些事情你们要做,哪些是要放弃或者说回避,或者说引入更多的合作伙伴?边界会有吗?

我不知道,因为,第一,这件事情是没有被完全定义好的。就像你修一条路,建一个城市,要不要沥青厂,谁来供应沥青,铺沥青的机器谁来提供,分工也是需要很长时间的。

提出这个问题的人,大概都觉得城市大脑是一个成熟的行业,但实际上不是,每位从事相关研究的人都要为此付出很大的代价。恰恰这样,我们才有机会。但回过头来看,有一件事情是明确的,那就是阿里云在这其中最核心的、最基本的、也是不可替代的,就是为城市大脑提供计算资源,这是我可以讲清楚的地方。

那同样也可以讲清楚的地方,为什么叫城市大脑?就是这条路一定属于这个城市的,就像修路,不能因为哪个包工队修了这条路,最后这个路是包工队的,这个逻辑是不对的。同样,阿里云为什么能做这件事情,是因为云计算的平台是最重要的基础,离开了云计算是没有办法谈这件事情的,至于在这上面衍生了什么,我觉得这是慢慢发展的过程。

我们对 AI 的东西,某种意义上是高估的,但对 AI 的潜力是低估的。

你每天典型的工作状态是怎么样的,比较关心的问题都是什么?

我觉得其实还是很简单的,其实我还是很运气的,还可以天天碰到你觉得很有意思的事情,包括计划今年 5 月在云栖小镇举办 2050 大会这样的东西。

所以你说我今天什么状态,我觉得蛮有意思的。因为我从大学毕业到现在,还能碰到这么多有意思的事情,是极其幸运的。

如果说工作状态,严格意义上,我觉得很运气的地方,是我从一个具体的 KPI 里面跳出来了,但还有机会和想法去做很多具体的事情。而且我可以考虑细节问题,所以才能看到别人没有机会碰到的问题。

城市大脑是个基础设施,实际上这是一个非常基本的思考,只是大家不会做那么基本的思考,愿意把它当成是一个所谓的层次高的事情,就把自己搞坏掉了。

所以我为什么总拿下水道举例子,为什么喜欢用 Fundamental 这个词,Fundamental 可以理解成最基础的东西,也可以理解成层次很高的东西,但是它仍然是很基础的东西。

相比互联网和移动互联网,AI 的价值和外延有很大区别吗?

我觉得还是有本质差别的。到现在为止,我们对 AI 的东西,某种意义上是高估的,但对 AI 的潜力是低估的,就跟软件一样。

我觉得 AI 跟互联网的关系,是软件跟硬件的关系,软件的重要性怎么强调都不为过,但是没有硬件,就相当于灵魂没有安放之处。

所以大家今天讲 AI 的重要性,甚至有人说互联网时代过去了,这是很危险的说法。没有互联网,今天的 AI 是没有藏身之处的,灵魂是没有安身之处的。

它们之间关系比软件、硬件还更加进一步的地方是什么?硬件相对比较成熟一点,软件创造的可能性要大过硬件,这是为什么软件的想象力要大一点的地方。

不管什么网,对我来说都是互联网。但实际上你提到的互联网、移动互联网,甚至物联网,这种不同的叫法本身就说明互联网还不成熟,有这么多所谓的网出来,就表明这台电脑今天是不成熟的,远不像 PC 的架构那么清楚。

所以 AI 的灵魂安放在哪里,今天还是模糊的。我说分布式智能就是这个原因,很难说这个东西在哪里了。今天所谓的 AI,就是彻头彻尾的一个分布式智能,就是说你很难说智能就在手机上。就像人的智能,其实也不完全是在大脑里。

之前听到过一个观点,说人工智能带来的改变可能是立体的,它可以渗透到各个经济利益体中。

人工智能得益于计算通过互联网到处都是,所以人工智能是不可能到达计算不到达的地方。就像水到不了的地方没有生命,这句话我觉得要旗帜鲜明地说出来,至少知道边界在哪里。

今年无人不谈 AI,公司融资额都相当惊人。但具体到每一个公司感觉大多数仍然面目模糊。这样的热度还能维持多久?你怎么判断?

我觉得,大家高估了现有人工智能框架(以深度学习为代表)的影响力,但是大家低估了计算这些最基本的东西对我们的推动作用。不过,人工智能为什么这么热,是有道理的。你想有一个技术框架,既可以解决视觉的问题,也可以解决自然语言处理的问题,这是非常了不起的。

我今天看到的一个挑战是,有些事情曾经很重要,但大家都知道这个时代过去了。

我经常会举一个例子,比如语音识别,语音识别大家都知道,识别率也很高,比人的识别率都高。可是我们人没有觉得你理解错了好像有什么奇怪的地方对不对?所以我有时候会开玩笑,我说语音识别识出来是机器智能,你不能说它错了,只是机器这么认为而已。

回过头来看,这说明什么问题呢,我们要问问我们要解决的问题是不是对的,对这个社会发展最大的价值是不是在这个地方?再回过头来,我们把语音识别搞成了 100% 让人满意的时候,如果我们的城市已经完蛋了,大家都活不下来了,那为什么不能用这些资源来解决我们今天城市更迫切的问题?如何用最少的资源推动社会的发展,是需要大家去思考的。


产业
刘燕
刘燕

机器之心编辑

返回顶部