资本「寒冬」已至,人工智能会同样遇冷吗?

回顾今年国内政策方向和科技巨头的战略布局,不难看出2018年是大数据、AI、互联网三大基础设施技术赋能各行各业的重要一年,发展产业互联网、产业智能与产业大数据已成为众多公司的重要战略目标。然而,今年的寒冬也同样凛冽。国内经济处于下行周期,加之中美贸易战的影响,引发了一些失业潮、跑路潮、返乡潮……不少企业都已扛不住寒冬的压力纷纷开始裁员。那么,在这个号称“寒冬”的时代,人工智能会同样遇冷吗?

一、今年人工智能寒冬论强势来袭

人工智能诞生这60年间,发展过程起起落落,先后经历了 Pre-AI 时代、黄金时代、第一次低谷、第二次繁荣、第二次低谷,我们目前正处于第三次浪潮之中。与前两次不同,第三次人工智能的热潮迎来了全面商业化的爆发。互联网兴起产生的海量数据、以及摩尔定律带来的计算力的突飞猛进,推动了深度学习技术在人工智能领域的普及,并促进语音识别、图像识别等技术快速发展并且迅速产业化。不过,在今年5月底,“人工智能寒冬论”再次强势来袭。当时,计算机视觉领域的专家 Filip Piekniewski 发表了一篇名为《AI Winter Is Well On Its Way》的文章。他指出,人工智能寒冬必将到来,并列出了三个论据:深度学习技术没有突破进展;深度学习无法扩大规模;自动驾驶濒临崩溃。

今年10月,Filip Piekniewski又发表了一篇文章,用这半年来人工智能的发展给“人工智能寒冬论”提供支撑。首先,他提到如李飞飞吴恩达人工智能领域的“大牛”在社交媒体上的活跃度已经远不如之前。然后,以特斯拉的完全自动驾驶为例,结合自动驾驶领域最近一段的动态,给出了“自动驾驶汽车的未来变得越来越不确定”的结论。同时,他还谈到了DeepMind和OpenAI最近的发展现状,称它们最近变得相当安静,在一些关键问题上并没有太多的进展。结合这些事实,Piekniewski得出结论:“更多的媒体已经开始注意到,我们已经处于一个巨大的人工智能泡沫之中了,这让人工智能行业已经没有了多少“新鲜空气”。但我认为,这个泡沫的最终破灭还需要一段时间,接下来的6个月很可能会非常有趣。” 

二、业界其他大佬并不认同

关于此番人工智能寒冬论,业界其他大牛大多表示并不赞同。

Facebook 首席科学家Yann LeCun认为,这篇文章纯属无稽之谈,Facebook、Google、Microsoft以及其他公司正紧密地加强 AI 布局。Facebook现在拥有一个专注于 AI 研究的团队。Microsoft事业部有三个部门,其中两个包含了“AI”名称(并没有提及“Windows”或“Office”)。Google 将其整个研究院重命名为“GoogleAI”。三家巨头在大力地招聘 AI 科学家及工程师,并没有看出减速现象。

吴恩达则认为,人工智能不会再度经历一个冬天。之前的人工智能冬天到来,是因为人工智能并没有创造太多的经济价值,而且相对来说,人工智能研究团队的工作被夸大了。在今天来看,人工智能已经成为一种类似于互联网和电力的通用技术,能够适用于许多行业。人工智能的兴起已经有了坚实的基础,有大量的公司正在通过人工智能来获取收入,人工智能已经有了一个清晰的路线图来创造大量的价值。自动化开始变得无处不在,这是不会消失的。

持有同样观点的还有Geoff Hinton。上周,他在接受记者采访时说道,不会有人工智能的冬天,因为 AI 技术已经用于手机。在旧人工智能的冬天,人工智能实际上不是你日常生活的一部分,但现在它是。 

总结Yann LeCun、吴恩达和Geoff Hinton三位大牛的观点,就是目前科技巨头依旧将发展AI作为重要战略目标,而如今人工智能技术不同于往日,逐渐开始从实验室和产业界飞入寻常百姓家,成为一项可以实用的技术,并且赋能各行各业。下面,我们可以通过分析2018年人工智能的进展来支持他们的观点。

三、2018人工智能领域的发展情况 

  • 人工智能产业依然高速前进

虽然今年的资本市场遇冷,但是 AI 领域却没有冷却的迹象。

盘点2018年全球融资最多的十家科技技术公司,中国有四家公司上榜,包括商汤科技、优必选、京东和依图科技。根据 CV Source 的数据,2018 上半年由于商汤科技云从科技优必选科技等企业获得高额投资,因此中国 AI 领域今年上半年的融资额已经超过 2017 年全年。

排名

公司

2018总融资额

成立年份

总部

所在领域

1

Uber

31亿美元

2009年

旧金山

无人驾驶

2

商汤科技

22.2亿美元

2014年

北京

人工智能

3

Cruise Automation

16.5亿美元

2013年

旧金山

无人驾驶

4

PTC

10亿美元

1985年

马萨诸塞州尼姆达

工业自动化

5

优必选

8.2亿美元

2012年

深圳

消费机器人

6

京东

5.5亿美元

1998年

北京

物流自动化

7

Zoox

5亿美元

2014年

加利福尼亚州福斯特市

无人驾驶

8

Ocado

4.4亿美元

2000年

英国哈特菲尔德

物流自动化

9

依图科技

3亿美元

2012年

上海

人工智能

10

Auris Health

2.2亿美元

2007年

加利福尼亚州雷德伍德市

医疗机器人

2018年全球融资最多的十家科技公司

尽管获得融资并不能保证取得成功,譬如今年10月筹得1.495亿美元资金的Rethink Robotics关门大吉,Airware和Jibo在分别烧钱1.14亿美元和7300万美元以后也遭遇了类似的命运,但是融资在拓展企业的规模和创新能力方面还是至关重要的,同时我们也可以看出,资本市场对 AI 的前景依然看好。

除了 AI 创业公司的巨额融资,国内科技巨头今年也在 AI 领域取得了一些突破性的成绩。

7月,百度李彦宏在百度 AI 开发者大会上宣布全球首款 L4 级量产自动驾驶巴士“阿波龙”正式量产下线,并称正在研发 AI 芯片——昆仑;9月,阿里巴巴杭州云栖大会上发布了首款 L4 车辆协同自动驾驶新能源车,并宣布成立平头哥半导体公司,大力发展 AI 芯片;10 月华为全联接大会 2018 上,华为轮值董事长徐直军公布了华为的 AI 发展战略,以及全栈全场景 AI 解决方案,其中包括 Ascend(昇腾) 系列芯片:昇腾 910 和昇腾 310。随着国内科技巨头纷纷加入 AI 芯片的战局,预计明年中国的 AI 芯片市场将迎来一波大丰收。

除了2018年人工智能产业方面的进展,在知名问答平台上Quora上,有人还总结了技术、道德伦理方面的成果,该回答不仅获得高赞,且被Yann LeCun转发支持:

  • AI炒作与恐惧情绪逐渐开始降温,人们更多关注公平性、可解释性等具体问题

2018年,一连串围绕人工智能丑闻的核心是问责制问题:当人工智能系统伤害我们时,谁负责?如何理解并解决这些危害?干预点在哪里?需要哪些额外的研究和监管来确保这些干预措施有效? 

尽管目前问题的答案很少,当前的人工智能治理框架无法确保问责,然而我们很高兴地看到,今年整个行业开始将关注重点放在更为具体且拥有解决可能的问题身上。例如,从业者们围绕公平性原则进行了大量讨论——除了与这一主题相关的各类会议(例如 FATML 以及 ACM FAT)之外,谷歌公司还开始发布在线课程。除此之外,今年得到广泛重视的议题还包括人工智能的可解释性、解释能力以及因果关系。 

  • 深度学习仍然地位稳固,并在实践当中超越图像分类这一传统应用方向(特别是在自然语言处理方面表现良好)

尽管深度学习能否作为最为普遍的人工智能范式这一问题仍然存在不少争议,但可以肯定的是:第一,深度学习绝不会就此止步;第二,深度学习还远没有达到其能够达到的高度。 

在 2018 年,深度学习方法在计算机视觉之外的领域——从语言处理到医疗保健——取得了前所未有的成功。事实上,深度学习最重大的影响很可能出现在自然语言处理(简称 NLP)领域,例如今年最令人印象深刻的 AI 应用,都是自然语言处理类。 

在 5 月的 Google I/O 2018 开发者大会上,Google Duplex 技术成为了今年科技行业最大的头条之一。这是一项可以让机器人在电话中进行自然对话并完成实际任务的新技术,结合了自然语言处理深度学习和文字语音转换,其效果让人真假难辨。10 月,Google AI 团队新发布的 BERT 模型,在机器阅读理解顶级水平测试 SQuAD1.1 中表现出惊人的成绩:两个衡量指标上全面超越人类,并且在 11 种不同 NLP 测试中创出最佳成绩。在计算机视觉处理中,人们越来越多地采用预训练好的大型网络来提取特征,然后再进行后续任务,而 BERT 的突破则为预训练在 NLP 领域的应用指明了方向。

除此之外,Allen 的 ELMO、Open AI 的 transformers,这些模型都堪称“自然语言处理领域的 Imagenet 时刻”,它们能够提供随时可用的预训练与通用模型,亦可针对特定任务进行微调。当然,除了语言模型之外,今年还出现了其它一些进步——例如 Facebook 的多语言嵌入等等。值得强调的是,我们还看到上述乃至更多其它方法被快速整合至通用性更高的自然语言处理框架当中——包括 AllenNLP 以及 Zalando 的 FLAIR。

四、企业依然不能太过乐观

尽管很多AI领域大牛认为人工智能寒冬不会到来,但这也并不意味着人工智能的发展态势非常好。

首先,在技术突破方面,尽管人工智能领域各类基础性突破有所增加,但其绝对数量仍然不够乐观。目前缺乏突破性成果的主要原因,在于现有方法及其变体仍有着大量的实践性应用空间,因此从业者们很难或者不愿冒险探索那些尚不具备实用意义的方向。

其次,在产业发展方面,很多企业经营者对人工智能技术的实际发展水平抱有不现实的期望。

吴恩达就此曾举例说,他经历过很多这样的情况:经常有首席执行官在演讲台上宣称,他们公司在人工智能方面做了什么,利用人工智能做了什么。但如果与他们的工程师交谈,这些工程师会说,“不,我们没有这样做,我们也不知道该怎么去做。”事实上,这种情况在自动驾驶领域并不少见。此前,自动驾驶汽车事故频发,马斯克信誓旦旦的完全自动驾驶能力,也一再延后上线,最后干脆在网站上删除了车辆“完全自动驾驶”选项。

为此,吴恩达也从经验中学习总结出一套AI商业化方法论。他指出,将传统行业与机器学习简单结合,并不会形成智能化公司,并从招聘人才组建AI团队,挑选AI项目,到战略结合方面提出了自己的思路见解。

“这是最好的时代,也是最坏的时代”,英国文学家狄更斯这样描述工业革命发生后的时代。对于 AI 来说,这同样是最坏的时代,也是最好的时代。

尽管目前AI产业存在很大泡沫,但显然并非百害而无一利。马云在今年回呛雷军“站在风口,猪都能飞起来”的这句名言时说,“风停了,摔死的都是猪”。对于AI产业而言,大浪淘沙,去伪存真,当这一轮AI泡沫退去,那些拥有数据、技术,并真正理解应用场景的公司,最终将成为这波人工智能浪潮中的最大赢家。同时,只有人们不断问责和监督人工智能技术、提出道德伦理要求并探讨可行的解决路径,在技术突飞猛进发展时不忘法律监管范围与时俱进,如此才能最大程度地让AI造福于人类,不至于让人类对AI的恐惧情绪持续蔓延。

THU数据派
THU数据派

THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。

产业计算机视觉自然语言处理图像分类自动驾驶深度学习
相关数据
依图科技机构

依图科技致力于人工智能创新性研究,是全球唯一获得美国国家标准技术局(NIST)、美国国家情报高级研究计划局(IARPA)两项人脸识别世界冠军的企业,在安防、医疗、金融、智慧城市、新零售、芯片等领域推出全球领先的创新技术和产品。 依图科技是国内的最大智能安防服务提供商,是破案最多、覆盖省份最多、服务警种最多的人工智能安防平台;依图是智能医疗领域领军企业,提供全球领先的AI影像辅助诊断系统、AI儿科临床辅助诊断系统和医疗大数据智能平台;依图是智能金融领域市场占有率最高的企业, 2016年全球首推刷脸ATM机,开创无卡交易的金融时代。

https://www.yitutech.com/
华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
商汤科技机构

商汤科技成立于 2014 年,专注于计算机视觉和深度学习的原创技术,是中国领先的人工智能头部公司,估值超过 45 亿美金。以「坚持原创,让 AI 引领人类进步」为使命,商汤科技建立了国内顶级的自主研发的深度学习超算中心,并成为中国一流的人工智能算法供应商。商汤科技不仅在技术实力上领跑行业,商业营收亦领先同行业,在多个垂直领域的市场占有率居首位。目前,商汤科技已与国内外多个行业的 400 多家领军企业建立合作,包括 Qualcomm、英伟达、本田、中国移动、银联、万达、苏宁、海航、中央网信办、华为、小米、OPPO、vivo、微博、科大讯飞等知名企业及政府机构,涵盖安防、金融、智能手机、移动互联网、汽车、智慧零售、机器人等诸多行业,为其提供基于人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等技术的完整解决方案。

www.sensetime.com
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

优必选科技机构

成立于2012年,优必选科技是一家集人工智能和人形机器人研发、平台软件开发运用及产品销售为一体的全球性高科技企业。

http://www.ubtrobot.com/
相关技术
云从科技机构

云从科技是从中国科学院孵化的人工智能企业,专注于人脸识别等计算机视觉技术研发。核心技术源于四院院士、计算机视觉之父——Thomas S. Huang 黄煦涛教授。研发团队曾于2007年到2016年7次斩获智能识别类世界大赛冠军。云从科技作为中国科学院战略性先导科技专项的唯一人脸识别团队,参与了人脸识别国标、部标、行标起草与制定; 2017年2月,云从科技入选国家发改委重大工程,与百度、腾讯、科大讯飞共同负责人工智能公共平台建设。

http://www.cloudwalk.cn/
吴恩达人物

斯坦福大学教授,人工智能著名学者,机器学习教育者。2011年,吴恩达在谷歌创建了谷歌大脑项目,以通过分布式集群计算机开发超大规模的人工神经网络。2014年5月16日,吴恩达加入百度,负责“百度大脑”计划,并担任百度公司首席科学家。2017年3月20日,吴恩达宣布从百度辞职。2017年12月,吴恩达宣布成立人工智能公司Landing.ai,并担任公司的首席执行官。2018年1月,吴恩达成立了投资机构AI Fund。

李飞飞人物

李飞飞,斯坦福大学计算机科学系教授,斯坦福视觉实验室负责人,斯坦福大学人工智能实验室(SAIL)前负责人。专业领域是计算机视觉和认知神经科学。2016年11月李飞飞加入谷歌,担任谷歌云AI/ML首席科学家。2018年9月,返回斯坦福任教,现为谷歌云AI/ML顾问。10月20日斯坦福大学「以人为中心的AI计划」开启,李飞飞担任联合负责人。11月20日李飞飞不再担任SAIL负责人,Christopher Manning接任该职位。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

基于Transformer 的双向编码器表征技术

BERT是谷歌发布的基于双向 Transformer的大规模预训练语言模型,该预训练模型能高效抽取文本信息并应用于各种NLP任务,并刷新了 11 项 NLP 任务的当前最优性能记录。BERT的全称是基于Transformer的双向编码器表征,其中“双向”表示模型在处理某一个词时,它能同时利用前面的词和后面的词两部分信息。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

摩尔定律技术

摩尔定律是由英特尔创始人之一戈登·摩尔提出来的。其内容为:积体电路上可容纳的电晶体数目,约每隔两年便会增加一倍;经常被引用的“18个月”,是由英特尔首席执行官大卫·豪斯所说:预计18个月会将芯片的性能提高一倍。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

推荐文章
暂无评论
暂无评论~