落地三大产业,深耕两个领域,百度 AI 的这一年 | 李彦宏的第五次乌镇行

在去年的乌镇世界互联网大会上,李彦宏提到了无人驾驶、智能城市,希望 AI 应用到各行各业。今天,他就带着百度 AI 过去一年里的落地成果,又一次来到了乌镇。

人工智能论坛上,他发表了主题为人工智能:产业升级新引擎”的演讲,随后还与腾讯公司董事会主席兼 CEO 马化腾进行了一次关于新时代数字经济的对话。

有点甜~

人工智能论坛上,李彦宏首先说道:

“我都不记得这是我今年第几次参加和人工智能相关的论坛了。人工智能这么热,很有可能意味着未来这几年会迎来中国人工智能发展的高峰阶段。”

随后,他就向大家分享了百度过去一年在人工智能方面所做的事情。

百度在2010年开始利用人工智能的技术,通过机器学习来重新调整我们的搜索算法,改进它的排序。但那时用的人工智能还不是后来的深度学习,只是一般意义上的机器学习

2012年的时候,我们首次开始用深度学习的方法来做图像识别,就是以图搜图,拍一张植物的照片,就能识别这是什么花。当时我们发现,用深度学习的方法来做效果非常好。

2013年1月份,我们成立了全球首个以深度学习来命名的研究院,百度的 IDL。自此以后,我们在 AI 上的投入越来越大。

2016年的时候,我们正式发布了百度大脑。

百度大脑经过三年的演进,内容越来越丰富,同时也越来越从底层技术向实用、应用发展。从最底层的深度学习框架,到上层相对比较通用的语音识别技术、视觉技术、自然语言理解技术等,再到各种开源和开放的平台,百度大脑可以说是百度所有人工智能最全的集合。

百度大脑从1.0到3.0,不断从技术层向应用层进化,百度 AI 正在全面落地国民经济三大产业。

第一产业 

对于农业来说,农民承包的土地面积越来越大,一个农民可能要种两千亩土地的粮食。当粮食发生了病虫害,是否能够及早地发现、及早地施药解决,这是很关键的。如果处理不及时,很可能会大量减收,甚至绝收。

人工智能的方法,通过遥感等工具,就可以非常精准、及时地发现病虫害,并且精准施药。对于农民来说,不仅可以节省大量的农药花费,我们每个人每天吃的东西,也会更放心一些。

现在,利用这样的方法,可以使农药的施药量降低50%,也就是说,我们每天吃的东西里面打的农药降低了50%。

第二产业 

对于第二产业工业来说,尤其是制造业,也有通过人工智能来进行改进的空间,比如像挖掘机。

挖掘机这个行当还是很大的,但现在的模式通常是一个农民,或者一个小企业主买十台挖掘机,再雇人到各个工地干活。这十台中恐怕平常有三台到五台都是闲置的,不是因为没活干,是因为没人来干活。现在的年轻人都吃不了苦,挖掘机现场又脏又累,非常苦。

但是用人工智能的方法,就可以让挖掘机实现少人、甚至在没人的情况下把活干了。

百度与拓疆者合作的无人自主挖掘机

第三产业 

在第三产业,刚才几位嘉宾也提到了,像医疗,我们怎么能够在早期去诊断、发现各种各样的病变、癌症呢?

我们最近做的一个项目是通过眼底筛查,及早地发现青光眼、黄斑病这些病症。而现在的这种技术,可以做到使它的准确率能够达到堪比10年左右经验的专业医生的诊断准确率

百度 AI 眼底筛查一体机

我们也决定在全国的贫困县当中选择500个点捐赠眼底筛查一体机,当然也包括相应的技术。

因为越基层的地方,医生的水平和医生的实力越是不够的,但是像眼底疾病,如果能够早发现、早治疗的话,就可以避免很多失明的风险。

对于百度来说,我们一直深耕的两个领域,一个是智能家庭、一个是自动驾驶

智能家庭 

在智能家庭方面,我们用的是一个叫做 DuerOS 的开放平台,这个体系最主要的功能就是实现人机对话,这方面最近的技术进步飞快。

我们最早看到的很多智能音箱,大家说这是“智障音箱”。网上一些宣传视频里很有意思的对话,其实基本上都是人编出来的,不是机器自己想出来的对话,如果真的连续问几句,基本上音箱就被问住了、问倒了。

但是我们最近再看,人的很多表达都已经可以被智能音箱理解,并且做出相应的响应了。

这也就是为什么我们看到现在使用 DuerOS 的设备越来越多,有1.5亿的激活设备,月活大概有3500万,也有很多的开发者在新的人机交互的平台上做各种各样的创新。

DuerOS 在智能手机、智能电视、智能音箱和儿童故事机等领域都有落地。在一些酒店的房间里也有这样的智能视频音箱,它基本上可以回答你的很多问题,不光是日常问题,一些跟酒店相关的问题,比如早餐在哪儿、游泳池开不开门等,它都可以回答。

DuerOS 现在在智能硬件方面布局得很广,已经进驻了41个国家、700多个城市。

自动驾驶 

在无人驾驶方面,百度采取了一个跟绝大多数公司不一样的方式——开源。

百度从2013年开始研发无人驾驶的技术,到现在已经有5年多的积累了。现在很多公司,包括 OEM 车厂,也包括很多创业公司都在研发无人驾驶技术,因为大家都意识到汽车工业100年的历史中,终于迎来了一个大发展、大变革的时代。

所以很多人都非常焦虑,虽然都在研发相应的无人驾驶技术,但其实大多数是在重新发明轮子。

我们意识到这个问题,就把百度做的东西都拿出来开源、开放,你随便用、随便改,如果愿意回来贡献一些那更好。

这个生态(Apollo 平台)只开放了一年多一点的时间,我们在全球已经有133家的生态伙伴、有1.1万开发者,它可以说是全球最早的自动驾驶生态,大家能想到的跟车相关的公司,基本上都加入了 Apollo 平台。

其实品牌产业化的落地方面,我们也看到了非常令人欣喜的进展。百度7月份发布的阿波龙就是一个既没有方向盘,也没有驾驶位的小巴车,可以全自动行驶。目前(阿波龙)已经在10个以上的地方落地,有了商业化的应用,也有了1万多小时以上的安全行驶记录。

阿波龙小巴车已经在北京海淀公园运营,欢迎大家来试乘!

这只是其中一个物种,更多其他的物种,比如像新石器的自动售货机,没有人开着到处去卖东西;还有公园里面的清扫车等等。我们很多地方想不到的,自动摘苹果的机器等,都是可以完全摆脱驾驶员的新物种,它未来几年会诞生一次爆发性的增长。

2019年,我们预计搭载 Apollo L4 自动驾驶能力的“新物种”将达到1万台!

车的智能化还需要一个配合,就是基础设施,就是路的智能化。

其实类比一下大家就非常清楚,我们现在讲的马路最早其实是跑马的,后来发明了汽车以后,它变成了跑汽车的。所以你可以想像,如果没有红绿灯,没有柏油路的话,汽车跑起来会非常痛苦。

同样,当无人车逐步开始在我们的生活中应用的时候,路要跟着变得更聪明、要变得更加智能。过去我们的城市都花了很多钱建造立交桥、建造地铁、建造大型停车场,都是为了解决交通问题,但是未来可能更多的基础设施要投入在软件,投入在智能化上。

我们也跟中国的不少城市有合作,比如北京。我们在海淀区,就会接管它所有的红绿灯,智能实时地进行调整。

根据测算,可以使得人们在交通拥堵中等待的时间减少30%到40%。因为我们的摄像头可以全量、实时地监控目前在路上到底有多少车,怎么样来调整红绿灯的时间,才能让交通更加通畅。

同样,上海,我们也是在智能交通、自动驾驶以及工业升级等方面有合作,争取在全球率先探索出来一个具有超前理念的、自动驾驶渗透率很高的样板工程。

这方面我还是很兴奋和激动的,因为我们每个人,尤其是住在中国的这些大城市的人,都是深受交通拥堵之苦的。

根据中国交通运输部的测算,交通拥堵给 GDP 带来的损失高达5%到8%。也就是说,像北京、上海这样的大城市,因为交通拥堵,每年都是上千亿的损失。所以这方面,百度用人工智能的方式重新做一遍,可以大幅度提升人们的感知,降低能源的消耗,也大幅度的提升工作的效率。

我们在这方面能够做的非常多,很希望跟各位一起共同努力,让人工智能早日进入各行各业,早日为大家的生活带来便利,早日为我们的生产提供更高的效率!

除了人工智能论坛以外,李彦宏与马化腾还出席了由高瓴资本创始人兼首席执行官张磊主持的,主题为“新时代的数字经济”的对话。

谈到在 AI 思维下消费互联网和产业互联网会发生怎么样的融合,以及中国数字经济的前景会有怎么样进行演变时,李彦宏说:

如果从我的角度来看,我确实认为,互联网时代和人工智能是两个不同的时代。

现在很多人经常会把这两个东西混起来谈,甚至有人觉得,人工智能是互联网的一个分支,我完全不认可这样的观点。

有人说,人工智能时代不是也要用互联网吗?这就好像说互联网时代不是也要用电吗?但是没有人会觉得,过去20年是一个电力发展的时代,我觉得这还是有一个质的区别的。

过去20年是一个互联网时代,但是未来30年、50年是一个人工智能时代。我觉得,人工智能时代不仅仅会深刻地改变、影响我们消费的领域,也会深刻彻底地改变产业、改变 To B 的领域。它对于人类社会的影响比互联网对人类社会的影响要更加深远。

我觉得从今往后,在人工智能的时代里面,真正要想改变产业的、改变各行各业的,恐怕是一个非常不一样的东西,跟我们过去熟悉的互联网是很不一样的。我们需要不断的适应这样一个新的时代,才有可能抓住相应的机会。

谈到如何把数字经济、人工智能变成公司战略时,李彦宏说:

进入一个新的时代,一定要有一个新的思维、新的战略,人工智能也会带来很多新的机会。

对于百度来说,一方面我们希望构建一个相对比较基础的平台,那就是“百度大脑”。它把人工智能的一些基础的设施、基础的能力做出来,同时开放,让大家自由使用。

另外在应用层面有两个场景我是比较看好的,一个是智能的家庭,一个是智能的交通,也包括无人驾驶。

智能家庭是一个很大的机会。

人机交互的模式从原来的鼠标、键盘再转向触摸屏,这是 PC 到移动互联网的转换。但是跟触摸屏相比的话,我们用语音、用自然语言,就是一种更加自然的人机交互的方式。我觉得未来家庭里面,人们跟各种各样的设备交互,应该是用自然语言来交互,这个是人工智能时代一个很大的特点。

第二就是智能交通、包括无人驾驶。

无人驾驶是很多人的梦想,也是一个非常大的市场,与此同时,我们也觉得基础设施,比如公路也要做相应的改造。无人驾驶时代的路面改造,是要很多智能的技术深入进去的,可以大幅度的提升人们的出行效率。

所以以上这两个方向,是百度目前从应用的角度来说一直在做的。

谈到企业对社会的责任时,李彦宏说:

百度是2000年起步的,Pony(马化腾)比我们稍微早一年多时间,我们赶上了非常好的时候,中国互联网刚开始还不到1千万网民。这十几年、二十年高速度的成长,实际上给我们带来了很多机会。

但是这20年的成长过程当中,我们遇到的坎儿、如何解决,这些东西对于一些新的创业者是很有价值的。如果说我们到处去讲,能够给大家在这方面提供一些参考,提供一些过来人的经验,让大家少走弯路,还是会有帮助,这是第一。

第二,人工智能的开放平台,对于整个社会经济、生活、文化各个方面都有相当大的影响。可是有多少人,有多少公司真正有实力去开发一些先进的人工智能技术?我们希望把过去积累的这些技术、这些能力开源开放出来,并且降低门槛。

我给我们内部很多部门在定义业务实力的时候,都把降低门槛这个元素放进去了。如果说什么都不用学,他们就可以很方便地用到我们的技术,那我们就算对这个社会做贡献了。

谈到如何拥抱数字经济的大潮时,李彦宏说:

我觉得首先就是不要害怕。

很多人怕新技术、怕人工智能的到来,甚至有一些特别可怕的预言,说机器控制人类之类的,没有那么可怕这个技术还有很长的路要走。 

在不怕的情况下,勇敢地去拥抱。

我们把过去积累的东西全部都开源开放出来,希望大家勇敢来用,不会你想像得那么难。要想理解人工智能,一个词就可以理解了,就是 Common Sense,就是常识。如果这条路想通了,很多时候问题就迎刃而解了,就可以大幅度提升我们现在工作的效率了。

从智能家庭,到自动驾驶,再到智能城市,百度始终在努力给大家提供更好的人工智能技术,并应用到生活的方方面面。

无论是走入千家万户的小度智能音箱,还是开进北京海淀公园的阿波龙无人小巴车,都是百度 AI 持续落地的一点成果。未来,我们还会不断进步,用 AI 让生活更便捷、未来更美好!

百度AI
百度AI

产业人机交互自动驾驶语音识别深度学习机器学习百度AI世界互联网大会李彦宏
11
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
厉害了