AICC 2019王海峰:百度大脑AI大生产平台助力产业智能化成果

算力是AI发展的重要基础。8月27-28日,由中国工程院信息与电子工程学部主办的AICC 2019人工智能计算大会上,与会嘉宾就AI计算和AI创新展开了探讨。百度首席技术官王海峰发表题为《人工智能加速产业智能化升级》的演讲,分享了百度对于AI计算发展的洞察,并介绍百度AI在算力、算法等层面的最新进展和助力产业智能化的成果。

王海峰表示,迄今为止人类经历的三次工业革命,分别以机械技术、电气技术和信息技术为核心驱动力,而这些技术都表现出很强的通用性。当前,我们身处以人工智能为核心驱动力量的新一轮科技革命和产业变革大潮,人工智能正在将人类社会带入智能时代。

百度是国内投入最早、技术最强、布局最完整的AI领军企业,在AI技术领域保持领先优势,并积极建设人工智能开源开放平台,推动应用落地,促进产业智能化的发展。百度人工智能技术多年积累和业务实践的集大成——百度大脑布局完整,核心技术领先,既有基础的算法、数据和算力,也有语音、视觉、AR/VR 等感知技术,自然语言处理知识图谱等语言与知识技术,还包括开源开放、支持产业应用的AI平台与生态,并打造了完整的AI安全防护体系。

图片包含 天空, 监视器, 蓝色

描述已自动生成

近年来,在数据、算法和算力三要素的共同作用下,人工智能技术取得巨大进步,尤其是深度学习领域突破显著。

语音识别准确率不断提升,在很多场景中已经超过人类。百度今年实现了注意力模型在大规模线上语音识别系统中的应用,同时准确率进一步提升。该技术应用于智能音箱和语音输入法等产品,实现高精准的中英文混合语音识别

语音合成也取得巨大进展。百度前不久上线的并行WaveRNN模型,解决了WaveNet模型需要大量计算资源的问题,合成效果大幅提升,同时能够满足在线的实时需求。

通过结合端侧的算力,百度领先的语音技术正在发挥越来越大的价值。百度打造了一款针对远场语音交互的芯片“鸿鹄”,按照车规级打造,采用HiFi4自定义指令集,双核DSP核心,平均功耗仅100mW,可实现远场阵列信号的实时处理和高精度低误报语音唤醒,并集成离线语音识别功能,适配车载语音交互、智能家居等各种场景。

计算机视觉技术也越来越实用化,形成适用于不同应用场景的技术矩阵,如文字识别(OCR)、图像处理、人脸/人体识别、图像生成、人机交互等。综合应用语音和视觉技术,机器可以自动合成虚拟形象。百度大脑的虚拟形象自动生成技术,可以对语音信号和视频信号进行识别与理解,再通过唇动生成,以及语音、面部和肢体的合成,自动生成一个虚拟形象。

在认知技术上,百度建立了完整的、包含知识图谱、语言理解、语言生成等在内的语言和知识技术体系,构建了世界上最大的多源异构知识图谱,在包含数亿实体、千亿级事实,能够满足90%用户需求的实体图谱的基础上,针对不同的应用场景和知识形态建立起关注点图谱、行业知识图谱、POI图谱、事件图谱等多种知识图谱。例如视频理解知识图谱百度大脑结合视觉、语音和自然语言处理技术解析多模态信息,并与知识图谱的相关实体建立关联,通过计算和推理,得到视频内容的结构化语义表示,从而精确解析一部视频中出现的人物及其关系、音频、事件、主题等信息。

自然语言处理方面,百度发布了基于知识增强的ERNIE 模型,通过建模海量数据中的实体概念等先验语义知识,学习真实世界的语义关系。这种融合知识的语义建模大幅增强了模型的语义表示能力,在共计16个中英文自然语言处理任务上超越了谷歌BERT和XLNet, 取得了SOTA效果。百度的语言与知识技术已经广泛应用于机器同传、智能写作等产品中。在机器同传领域,百度综合联合词向量解码、语篇翻译模型等新技术,实现高准确、低时延的机器同传,并发布了语音到语音的机器同传系统:DuTongChuan(度同传),翻译效果极具竞争力。

人工智能技术快速发展,离不开算力的支撑。算法持续突破,算力缺口巨大,王海峰认为,这需要算法、计算架构等多方面努力来解决。

百度大脑的AI计算架构,实现了芯片、互联、系统和调度的协同设计和技术创新,并紧密结合百度飞桨(PaddlePaddle)训练与推理框架,提供面向算法优化的极致效率,并做到异构、无感的使用。

图片包含 屏幕截图, 天空, 监视器, 蓝色

描述已自动生成

王海峰指出,在智能时代,深度学习框架起到承上启下的作用,下接芯片,上承各种应用,是“智能时代的操作系统”。百度打造了中国首个也是目前国内唯一开源开放、功能完备的深度学习平台——百度飞桨。飞桨的核心框架,包括开发、训练和预测,以及涵盖推荐、视觉、自然语言处理、语音等在内的丰富模型库。同时,飞桨提供包括迁移学习、强化学习、自动化网络结构设计、训练可视化工具、弹性深度学习计算、图神经网络等在内的工具组件,以及零基础定制化训练和服务平台EasyDL、一站式实训开发平台AI Studio和端计算模型生成平台EasyEdge等服务平台。飞桨也与浪潮在算力层面进行合作,进一步降低深度学习应用门槛,加速推动产业智能化变革。

图片包含 监视器, 屏幕截图, 天空, 墙壁

描述已自动生成

基于对中国产业的深度洞察和对中国开发者的理解,飞桨具备五大核心优势:同时支持动态图和静态图的编程,能够兼顾易用性和效率;开源70多个经过真实业务场景验证的官方模型,涵盖视觉、NLP、推荐等 AI核心技术领域;具备适用大规模数据场景的分布式训练能力,从优化算力的角度为深度学习的应用提供支撑;提供包括底层硬件、推理引擎、多种程序设计语言、方案与服务工具在内的端到端全流程部署方案,助力产业开发者实现应用的快速落地。同时,针对没有深度学习技术基础的开发者,百度飞桨提供定制化训练和服务平台EasyDL,让他们可以基于自身业务需求和数据,快速训练定制化AI模型。

百度飞桨深度学习平台为核心基础,百度大脑实现了AI算法、计算架构和应用场景融合创新,成为“软硬一体AI大生产平台”。在数据和算力的基础上,打通了人工智能产业化应用落地的全部流程,实现了AI技术的标准化、自动化、模块化,助力开发者快速实现应用,带来价值。

图片包含 监视器, 屏幕截图, 天空, 蓝色

描述已自动生成

基于百度大脑AI平台,百度的AI技术已经应用于各行各业,带来了巨大的产业价值。王海峰以百度地图AI化数据生产、水培蔬菜智能种植,以及不同行业的应用为例,介绍了人工智能助力产业智能化的效果。例如,百度飞桨基于遥感影像数据,研究高精度、高自动化的目标地物检测、土地覆盖和土地利用分类方法,可以辅助国家进行重大工程用地扩张与变化情况的监测工作,并对土地资源的利用进行有效管理与控制;基于视觉技术及深度学习算法构建的智能无土栽培解决方案,将原来农业专家的个人经验进行了数字化、产品化,使无土栽培作物生产具备了规模化生产的可能性。

据麦肯锡预测,人工智能将显著驱动经济增长,更快应用AI 的领跑者将获得更大的经济收益。现阶段,百度人工智能技术度持续发展突破和深度学习技术及平台的开源开放,将加速人工智能技术与产业融合,加速产业智能化,让AI时代更快到来!

产业百度AICC 2019王海峰
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

遥感技术

遥感(remote sensing)是指非接触的、远距离的探测技术。一般指运用传感器/遥感器探测物体的电磁波辐射、反射特性。遥感通过遥感器这类对电磁波敏感的仪器,在远离目标和非接触目标物体条件下探测目标。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
推荐文章
暂无评论
暂无评论~