发布AI芯片昆仑和百度大脑3.0、L4自动驾驶巴士量产下线,这是百度All in AI一年后的最新答卷

去年的 7 月 5 日,百度在北京国际会议中心开办了首届「AI 开发者大会」。在会上,百度首次喊出了「All in AI」的口号。一年的时间过去了,今天在同样地点举行的第二届开发者大会上,李彦宏说道:去年我吹过一个牛,百度的 L4 级别无人驾驶车的量产,会在 2018 年的 7 月份。今天我要说的是,这个牛,马上就要实现了!而百度的最新战略、技术实力、以及生态发展也在这场大会上一一展现在我们的面前。

本次大会的亮点:

  • 全球首款 L4 自动驾驶巴士「阿波龙」量产下线

  • 中国第一款全功能云端 AI 芯片「昆仑」

  • 发布百度大脑 3.0

  • 推出百度智能小程序

全球首款 L4 自动驾驶巴士「阿波龙」量产下线

首先亮相的是百度创始人、董事长兼首席执行官李彦宏。在大会的主 Keynote 环节中,李彦宏介宣布,全球首款 L4 级自动驾驶巴士量产下线。此自动驾驶巴士由百度与金龙客车合作制造,取名为阿波龙。当前,阿波龙巴士在北京雄安、广州、深圳、东京等地开始商业运营。其中阿波龙客车在东京的商业运营,是百度与软银合作进行的。

百度称,「阿波龙」搭载了「面向量产的解决方案」,它会成为 Apollo 3.0 的核心。此次发布的三套自动驾驶解决方案,可帮助开发者及合作伙伴三个月内即可打造出属于自己的「阿波龙」。

李彦宏介绍说,一年前刚刚推出的 Apollo1.0 有 3 万 5 千行代码,而现在 Appolo3.0 已有超过 22 万行代码。「自动驾驶刚刚实现了从零到一,未来一定会实现从一到百、千、万」,李彦宏表示,「而这些都将由我们的开发者来实现。AI 时代的汽车进化逻辑是内部软件数量的增长。」

除了「行」之外,AI 也在改变着我们的「住」。

自动驾驶之后,李彦宏展示百度在人机交互方面的应用。大会现场播放了两段录音,展现了百度开发的 AI 大会客服与参会者打电话的情景,AI 客服可以通过电话确认观众是否参会以及提供餐饮信息。

在这个环节,李彦宏透露了百度过去几年来在 AI 技术研发上的投入,「百度每年会把 15% 左右的收入投入到 AI 技术的研发中。」从上万名 AI 工程师,到百万台服务器组成的集群,以及千亿级的参数、样本及特征训练而成神经网络,这样的投入支撑了演示中的智能化生活。

百度希望让人们平等便捷的获取信息,利用数据、算力和算法的不断迭代来填平「智能鸿沟」,让每一个开发者都能够使用最先进的 AI 能力。「过去讲,用电量是衡量经济的指标,而以后,用脑量会是衡量行业智能化发展水平的标准。」李彦宏表示。AI 可以把人从重复、低效、繁重的判断工作中解放出来,极大地提高生产力。例如,百度和某工厂合作,利用人工智能技术去进行地板质量检测,使每天检测量翻倍。此外李彦宏还提到,百度希望各行业的人都能平等便捷获取 AI 能力。例如一位来自西藏林芝的医生,通过百度的 easyDL 去识别寄生虫虫卵,诊断准确率达到 97%。

大浪潮下的 AI 芯片

随着人工智能技术的发展,计算硬件也经历了从 CPU、GPU 到专用芯片的过程。今日,李彦宏宣布正式发布百度自研的中国第一款云端全功能 AI 芯片"昆仑",其中包含训练芯片昆仑 818-300,推理芯片昆仑 818-100。

「昆仑」是中国在大规模 AI 运算实践中催生出的芯片,基于百度 8 年的 CPU、GPU 和 FPGA 的 AI 加速器的研发,20 多次迭代而生。李彦宏称,「昆仑」是迄今为止业内设计算力最高的 AI 芯片。据介绍,它采用了三星 14nm 工艺;260Tops 性能;512GB/s 内存带宽;100+w 功耗,由几万个小核心构成,它可以同时满足训练和推断的需求,除了常用的云端深度学习计算需求,还能适配诸如自然语言处理,大规模语音识别自动驾驶,大规模推荐等具体终端场景的计算需求。

中国著名计算机专家,首批中国工程院院士倪光南表示,「中兴事件发生后,各界都十分关注发展我国芯片产业,许多互联网企业和传统电子企业纷纷表示,要大力投入资金和队伍发展芯片事业,这种积极性应当肯定。这次百度发布了 AI 芯片,说明他们说到做到,这无疑是对我国芯片事业做出了贡献。

百度一贯重视 AI,这次做 AI 芯片,可以发挥他们在 AI 方面的积累的技术优势,而且做出的芯片可以首先在它自己的 AI 平台及其应用上得到应用,通过应用可以推动芯片的发展,形成一个良性循环。当然,如果这个芯片使用效果好,就可以被更多的用户所采用。大家知道,芯片的成功,需要有生态的支持,这方面百度有较好的条件。」

最后,百度方便表示,未来该芯片将面向智能汽车、智能硬件、图像语音等更多应用开放。

发布百度大脑 3.0

去年,百度在开发者大会上推出了自然语言处理系统 DuerOS 和自动驾驶系统 Apollo,以及百度大脑 2.0。在今天的大会上,百度宣布这些技术都已演进到了 3.0 版,涵盖了技术、平台、生态落地全栈布局。百度高级副总裁王海峰介绍说,今日发布的百度大脑 3.0 开放的能力已经达到了 110 多项。

王海峰表示,「其最核心的是多模态深度语义理解。这意味着对于图像、语音和视频等多模态信息,不仅让机器可以听清、看清,更要深入理解其背后的含义,从而更好地支撑各种应用。」

基于语义的数据,百度的人工智能可以进行进行理解、总结和提炼,并形成知识,为用户提高生产力。在会上,百度展示了视觉语义化在无人超市购物场景中的应用,其可以识别购物者在商店中的所有行为,并利用刷脸进行结算。此外,目前新版的百度地图中的小度语音助手已经可以理解复杂的语义请求,并帮助用户进行导航。

在阅读理解上,「我们最近又将深度注意力匹配模型引入到了系统中,让 AI 系统对话的效果进一步提升。」王海峰表示,「百度大脑一直在不断学习,目前已经阅读了超过千亿篇文章。」

在上面介绍的 NLP、计算机视觉技术之下,是百度的深度学习框架。百度自 2013 年开始自主研发深度学习平台,2016 年 9 月对外发布了自己的深度学习框架 PaddlePaddle,而在今天,百度发布了 PaddlePaddle 3.0。

王海峰介绍说,除了核心框架升级以外,还提供了三个非常好用的平台,EasyDL 快速应用平台,AutoDL 网络结构自动化设计,以及 AI Studio 在线实训平台。

在这里,王海峰对比了人工设计的网络结构与 AutoDL 网络的效果。

谈到深度学习框架与 AI 生态的关系,王海峰认为深度学习框架可以类比为 AI 的操作系统。向下,它可以与 AI 芯片结合。AI 芯片在对 AI 模型的计算进行专门优化后,性能会有很大的提升。从这个角度看,百度认为,深度学习框架相当于 AI 芯片的指令集。

最后,王海峰总结说,「目前百度大脑 3.0 开放了 110 多项能力,每天调用次数已经超过了 4090 亿次。调用的人中既有 AI 工程师,也有零『AI』基础的初入门者,还有来自各行各业希望用 AI 创新业务、为业务转型升级的企业。」

百度智能小程序

在上午的大会上,百度除了介绍百度大脑 3.0、DuerOS 3.0 以及 Apollo 3.0 等更新换代的产品以外,还推出了「智能小程序」。

百度认为,互联网近几年来正在从开放走向封闭——越来越多的用户流量被圈定在极少数的平台上,这种趋势形成了围墙花园的形态,一些巨头通过尽可能多的服务来阻止用户使用其他公司的服务。然而,用户的需求往往是多元的,我们急需一个完整的解决方案来重塑这种生态。

「构建自然的用户体验系统,打造 AI 时代的最佳移动体验。」百度副总裁沈抖介绍道。「通过智能小程序,我们能够给用户提供一种无缝的端内体验。」百度还会把在移动端的 AI 框架开放给开发者,帮助他们实现更多的应用。

目前,智能小程序已经在百度 APP 中上线。沈抖表示,百度智能小程序全面接入百度大脑 3.0,开发者通过几行代码就可以调用。同时,智能小程序将于今年 12 月全面开源。未来,智能小程序不仅可以运行于百度系 App 上,还将可以运营于哔哩哔哩、58 同城等外部合作伙伴 App 上。

结语

一年一度的百度 AI 开发者大会的主题词「Create」来自编程语言中用于创建新内容的函数,更意味着从无到有地创造新事物,在已知已有的领域进行革命性创新。如同李彦宏所描述的愿景:「Everyone can AI」,开发者将成为 AI 时代的核心生产力。

产业百度开发者大会自动驾驶
1
相关数据
神经网络技术
Neural Network

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

计算机视觉技术
Computer Vision

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

逻辑技术
Logic

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

人机交互技术
Human-computer interaction

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

自然语言处理技术
Natural language processing

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

参数技术
parameter

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

自动驾驶技术
self-driving

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

语音识别技术
Speech Recognition

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

深度学习技术
Deep learning

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。 近年来监督式深度学习方法(以反馈算法训练CNN、LSTM等)获得了空前的成功,而基于半监督或非监督式的方法(如DBM、DBN、stacked autoencoder)虽然在深度学习兴起阶段起到了重要的启蒙作用,但仍处在研究阶段并已获得不错的进展。在未来,非监督式学习将是深度学习的重要研究方向,因为人和动物的学习大多是非监督式的,我们通过观察来发现世界的构造,而不是被提前告知所有物体的名字。 至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

准确率技术
Accuracy

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

李泽南
李泽南

You will always be lucky if you know how to make friends with strange cats.

推荐文章
情绪激动的陆奇在CES发布阿波罗2.0, 带着黑眼圈的景鲲又扩大了DuerOS的朋友圈情绪激动的陆奇在CES发布阿波罗2.0, 带着黑眼圈的景鲲又扩大了DuerOS的朋友圈
彭君韬彭君韬
专访百度云总经理尹世明:百度云 ABC 战略助力开发者,赋能各行业专访百度云总经理尹世明:百度云 ABC 战略助力开发者,赋能各行业
微胖微胖
让环境适应人类:百度展示AI时代的交互设计让环境适应人类:百度展示AI时代的交互设计
机器之心机器之心
1
返回顶部