算法王国

整理 | 侯韵楚 刘燕

来源 | 经济学人

今年年初,两件事吸引到那些正持续关注全球人工智能发展的人们。其一是微软的高管陆奇在 1 月表示,自行车事故之后,他将不再回到这家全球最大的软件公司任职,而将担任中国最大的搜索引擎公司——百度的首席运营官。而第二件则是该月末,由于 AAAI (国际人工智能协会)年会的原定日期与中国春节相冲突,最终将会议推迟。

这些迹象表明,在一些人工智能至关重要的领域,中国有可能实现弯道超车,比如语音助手、自动驾驶汽车等。陆奇解释道,中国就是这样的地方,而百度也是最为重要的参与者。他说:「我们有机会领导人工智能的未来」。事实证明他所言不虚。2016 年 10 月,白宫的一份报告指出,在人工智能的分支深度学习方面,中国发表的相关期刊文章已然超越了美国。咨询公司普华永道预测,在 2030 年之前,与人工智能相关的发展将会促使全球 GDP 增长16亿美元;据估计,近一半的财源都将累积至中国。尽管美国在绝对数量上仍然领先,但近几年来,中国研究人员所提交的人工智能相关的专利申请数量增加了近  200%(如下图表所示)。

             

若要了解为何中国如此得天独厚,便应当考虑人工智能所需的投入。中国拥有丰富的两大基本要素——计算能力以及资本。从阿里巴巴与腾讯这样的巨头,到 CIB FinTech 与 UCloud 这样的初创公司,这些中国企业都在加快速度建立数据中心。据咨询公司 Gartner 报道,云计算市场近年来已增长了 30% 之多,且将持续增长下去。据智囊团乌镇智库统计,2012 - 2016 年,中国的人工智能企业获得了 26 亿美元资金,虽然低于美国同行的 179 亿美元,但总体而言仍在飞速增长。

然而,能使中国真正成为人工智能「应许之地」的还有两种资源。其一便是研究型人才。微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋( Harry Shum )表示,除了数学方面的强大才能,中国还有研究语言和翻译的传统。在阿里巴巴负责管理 150 位数据科学家的闵万里说,在中国发现顶尖的人工智能专家要难于美国。但他预测,由于许多大学都推出了人工智能计划,所以未来几年将有所改变。据估计,中国拥有超过世界五分之二的高素质人工智能科学家。

其二是数据,即人工智能最为重要的部分。软件和数字产品在过去大多都遵循代码所制定的规则,因而拥有顶尖编程人员的国家便更具优势。随着深度学习算法的出现,这些规则愈发以从数据库中提取出的模式为基础。可用的数据越多,能够学习的算法也会更多,人工智能产品也会因此而更加智能。

中国的人口等规模及数据多样性为这一循环提供了有力的燃料。仅靠日常生活,全国近 1.4 亿人口所产生的数据便多于其他几个国家之和。即便是一些罕见病,也不曾缺乏用来教算法识别这种病的病例。由于打汉字比西方国家的文字更为费力,因此中国人往往比西方人更倾向于使用语音识别服务,于是公司便拥有更多语音片段来改进语音产品。

数据富矿

真正能够使中国大放异彩的是,它拥有约 7.3 亿的互联网用户,超过了其他任何国家。几乎所有人都通过智能手机上网,而它们含有传感器且方便携带,产生的数据远比台式电脑珍贵得多。例如,大型沿海城市的人们已不再使用现金进行小额购物,而是通过移动设备用支付宝和微信支付等完成交易。

中国人似乎并不十分重视隐私,这使数据更易于收集。例如,以迅雷不及掩耳之势风靡大型城市的共享单车服务,不仅提供了实惠的交通工具,而且它还是一种「数据播放」。当乘客租用单车时,一些公司便可以通过车上的 GPS 装置追踪用户的行动。

中国的年轻人似乎十分热衷于以人工智能驱动的服务,对个人数据的使用也很放松。小冰是微软开发的一个开朗乐观的聊天机器人,如今她已拥有超过 1 亿位中国用户。他们通常会在夜晚 11 点至凌晨 3 点之间讨论白天遇到的问题。她会从互动中学习,从而变得更加智能。小冰不再仅限于提供鼓励或讲笑话,而是创作了第一部人工智能创作诗集「阳光失了玻璃窗」,这引发了中国文学界对于是否存在人工智能诗的激烈讨论。

在中国,人工智能的另一个重要支持者便是政府,这项技术在其目前的五年计划中地位显赫。技术公司正与政府机构进行密切合作,如百度已响应号召,领导国家深度学习实验室。但政府用清规戒律对人工智能公司加压的可能性微乎其微,中国包含个人资料保护相关规定的法律有 40 多条,但它们鲜少得以执行。

企业家正在利用中国的人才与数据优势。许多人工智能公司仅建立两年时间,但与西方的同行相比进展神速。李开复是 21 世纪初的谷歌中国区总裁,如今是风投基金创新工场的创始人,他解释道:「中国的人工智能初创公司通常会更快地进行迭代与执行」。

于是,中国已然拥有了一批人工智能独角兽,这些初创公司的价值超过了 10 亿美元。位于北京的新闻聚合平台今日头条采用了机器学习,通过使用诸如读者兴趣及位置等信息来进行文章推荐;它还使用人工智能进行虚假信息过滤(在中国,主要是指可疑的医疗广告)。而另一家初创公司 iFlytek 则开发了一个语音助手,它能将普通话翻译为包括英语和德语在内的几种语言,即便是发言者使用俚语,或是存在背景噪音可能够正常工作。另外,旷视科技的人脸识别软件 Face ++几乎能够立即识别人脸。

「天网」生活

在旷视的总部,参观者往往像是在体验一场技术示范。大厅的摄像机并不显示 ID :员工进出不必出示徽章。整个办公室的设备都是类似的,而反馈则显示在视频墙上。当墙上出现人脸时,会立即被一个白色矩形框起来,同时显示这个人的相关信息。屏幕的右上角则鲜明地标示出「 Skynet 」,这是终结者系列电影中消灭人类的人工智能系统名称。这家公司已经授权支付宝和叫车服务公司滴滴来检查新客户的身份——将他们的面部与政府的登记图片作对比。

为应对这些初创公司的成功,中国的科技巨头也开始大力投资人工智能。百度、阿里巴巴和腾讯(统称为 BAT )正在开展许多相同服务,包括语言及人脸识别。但他们也试图凭借自身优势,在人工智能的特定领域占领主导地位。

迄今为止,腾讯保持着最低配置,几个月前才建立人工智能实验室。但它势必在人工智能领域一鸣惊人:与另外两家互联网界巨头相比,它拥有更多数据。其微信的通讯服务拥有近 10 亿账户,并且它也是从付款、新闻到城市指南与法律帮助等数千服务的平台。腾讯在游戏方面同样是世界领先,其风靡一时的游戏,如英雄联盟与部落冲突在全球拥有超过 1 亿的玩家。

中国电子商务领域的巨头阿里巴巴,凭借数十亿美元的投入使其云服务业务在国内云计算领域做到排名第一。6 月,在上海举行的一次会议中,阿里巴巴展示了一个名为「 ET 工业大脑」的人工智能服务,它能够通过视频识别来实时优化交通,比如利用路边的摄像头预测汽车的行为,进行交通信号灯的调控。阿里巴巴称,这个系统已将其家乡杭州的平均交通速度提升了 11%。该公司还计划强化「 ET 医疗大脑」,它基于人工智能服务进行药物发现及医学影像的诊断,并已签署 10 余家医院来获得所需数据。

但百度的命运与人工智能连接最为紧密,部分原因在于也许技术便是追上阿里巴巴和腾讯的最大机遇。它将大部分资源都投入到了自动驾驶领域,希望能在 2018 年之前使自动驾驶汽车上市,并在2020 年之前为全自动汽车提供技术支持。7 月 5 日,百度在北京的 AI 开发者大会上发布了第一版本的自驾车系统,称为阿波罗。

阿波罗计划不仅要实现汽车在街道上的安全航行,同时也是一个向外开放项目。谷歌子公司 Waymo 、电动汽车公司特斯拉等竞争对手正在小心翼翼地守着自己的软件与收集的数据。而百度不仅计划开源其系统平台,而且还会进行数据共享。他们的想法是,使用百度技术的汽车制造商会做出同样的举动,从而为自动驾驶汽车的数据创造一个开放平台,用陆奇的话来说,便是「创建自动驾驶汽车的 Android 系统」。

像北京人一样开车

中国企业将人工智能产品推向海外能否成功还未可知,因为如今只有极少数公司这么做。它们理应发展很顺利:那些在中国熙熙攘攘的街道上进行了大量训练的自动驾驶汽车,在欧洲更为有序的交通道路上进行导航时理应该更不在话下;相反,在德国训练的汽车可能连北京的第一个路口都不大可能通过。西方消费者在使用时仍有所犹豫,因为自动驾驶汽车是在对事故耐受度更高、宽松而又安全的环境中进行培训。据称,北京市政府正在千方百计使其能成为自动驾驶汽车的试验城市。

还存在另一个风险。目前,数据是人工智能最珍贵的输入,但其重要性可能会降低。人工智能公司已经开始使用包括来自视频游戏的模拟数据,新型的算法则可能得以通过更少样本来实现同样的智能化效果。驭势科技是一家正在开发自动驾驶技术的北京初创公司,其首席执行官吴甘沙警告称:「其中的危机在于我们满足于数据上的优势从而停止了算法创新」。尽管目前为止,中国还正处于刚刚起步阶段,但在人工智能领先地位的角逐中,它在步步逼近美国。

入门算法产业人工智能中国数据美国
返回顶部