Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

从融合创新到降低门槛,全新发布的百度大脑7.0撑起AI时代「星辰大海」

百度大脑升级至 7.0,以融合创新、降低门槛为显著特点,通过百度智能云加速产业落地爆发。

百度首席技术官王海峰只用一句:「百度大脑,请帮我生成一个像主持人一样的数字人」,一个 AI 智能体就这样被定义完成了。

在今天上午百度世界大会的现场,百度不仅推出了新一代人工智能芯片昆仑芯 2、Aopllo「汽车机器人」,介绍了百度为中国跳水队打造的「3D+AI」跳水辅助训练系统、百度智能云加速产业智能化的四大案例,还宣布与中国航天进行合作。这些 AI 应用背后的核心技术底座——百度大脑也实现了全面升级。

「我们看到、感受到的这些变化,背后的技术都来源于百度大脑,」王海峰说道。「以人工智能等为代表的新一代信息技术正在驱动新一轮科技革命和产业变革。在新的发展阶段,AI 技术越来越复杂,融合创新正在成为新常态;同时,随着人工智能技术在各行业的渗透,面向不同应用场景,降低门槛也变得越来越重要。」

在今天的大会上,王海峰正式发布全新升级的百度大脑 7.0,具备「融合创新」和「降低门槛」两大显著特点,融合创新使 AI 能力越来越强,降低门槛让应用 AI 技术越来越容易。

百度大脑 7.0:融合 AI 最强能力

怎样理解融合创新?百度认为,这其中包括知识与深度学习技术融合、跨模态多技术融合、技术与场景融合、软硬一体融合四个方面。其实早在几年前,王海峰就曾提出过融合创新这样的观点,如今这一思想体现在了最新的百度大脑 7.0 上。

会上,祝融号数字人与主持人流畅对话,不仅准确回答了「火星上能否种土豆」的问题,还以「登火星」为题作了一首诗。随后,王海峰又用一句话生成了一个数字人形象,并为他换上了航天服,让他跟祝融号数字人做朋友。这离不开「知识与深度学习的融合创新」,最典型的就是百度发布「知识增强大模型」, 把大规模知识图谱和海量的数据同时给到模型,进行联合训练。

7 月,百度刚刚升级的「知识增强大模型」 ERNIE 3.0 首次在百亿级参数预训练模型中引入大规模知识图谱,成为了 AI 领域的一次重要事件。

以 GPT-3、XLNet 为代表的预训练模型是人工智能技术最近的发展方向,其强大的通用性和卓越的迁移能力掀起了预训练模型向大规模参数化发展的浪潮。然而,此前的大规模预训练模型主要依赖纯文本学习,缺乏大规模知识指导的能力学习,模型能力存在一定局限。

ERNIE 3.0 进一步挖掘了大规模预训练模型的潜力,基于深度学习平台飞桨的分布式训练优势,首次在百亿级预训练模型中引入大规模知识图谱,提出了海量无监督文本与大规模知识图谱的平行预训练方法,大幅提升了对于知识的记忆和推理能力。

新版 ERNIE 一举刷新了 54 个中文 NLP 任务基准, 还同时具备超强的语言理解能力以及写小说、写歌词、生成诗歌、对联等文学创作能力,也能完成情感分析、阅读理解、数学运算、机器翻译等任务,做得都比原来业内最佳水平还要好。

祝融号数字人能够完成多种任务,应用了知识与深度学习的融合。

数字人的形象和生成,则需要跨模态多技术的融合。在世界大会现场,王海峰展示了一句话生成数字人能力,打造了一个懂你的 3D 形象设计师。这种方法融合了百度大脑在语音识别自然语言处理知识图谱增强现实等领域的能力,又做到了易于使用。

由于虚拟智能助手已经登陆百度 Apollo 系统,一句话生成形象的能力正在让汽车虚拟助手的生成变得更加高效,也更加个性化。

从应用角度来看,不同领域存在不同挑战,AI 技术需要深入到实际应用场景中,与场景融合创新。百度智能云在水务、电力、城市管理、制造等领域的产业应用,是技术与场景融合创新的成果。在百度世界大会上,王海峰展示的同声传译系统,是机器翻译、语音技术与同声传译场景融合,实现了高质量、低延迟的同传效果。

百度大脑 7.0 的融合创新中,还有一项非常重要的 「软硬一体融合创新」百度自主研制的 AI 芯片百度昆仑,使得 AI 模型计算效率更高、应用效果更好;针对远场语音交互研制的百度鸿鹄芯片,让人与汽车、智能家居等设备的语音交互更便捷、更流畅;同时百度也与合作伙伴一起构建硬件生态,比如飞桨平台目前已经适配 30 多款芯片。这就很考验造芯能力了,百度同样给出了自己的答卷。

昆仑芯 2 发布即量产,性能翻倍

这一波的 AI 浪潮是由 GPU 算力提升引发的,所有 AI 能力的底层都有芯片的功劳,在人工智能芯片方面,百度也实现了新的突破。

百度世界大会上,百度创始人、董事长兼 CEO 李彦宏宣布第二代自研 AI 芯片「昆仑芯 2」正式量产。

百度昆仑是百度自研的云端全功能 AI 芯片,2018 年发布第一代产品,至今在百度业务中已部署超过 2 万片,并服务于超过 50 家客户。到 2021 年 6 月,昆仑芯片又实现了独立融资,估值达到 130 亿元。

昆仑芯 2 性能、通用性、易用性较 1 代产品都有显著增强,证明了百度在芯片设计和软硬件整合方面的能力。

该芯片采用 7nm 制程,搭载了自研的第二代 XPU 架构,相比一代性能提升 2-3 倍,整数精度(INT8)算力达到 256 TeraOPS,最大功耗 120W。

昆仑芯 2 的设计使产品可以适用云、端、边等多场景,可应用于互联网核心算法、智慧城市、智慧工业等领域。

更重要的是,昆仑芯 AI 芯片除了拥有自研 XPU 架构及多项自主设计,针对语音、自然语言处理、图像等 AI 技术专门优化,支持飞桨等深度学习框架,可以让 AI 模型计算效率更高。

昆仑还与飞腾等多款国产通用处理器,麒麟等多款国产操作系统以及百度自研的飞桨深度学习框架完成了端到端的适配,实现了软硬一体的全栈国产 AI 能力。

百度的造芯历程,实际上是从 2011 年年开始的,昆仑芯 2 的十年磨一剑,意味着百度从芯片到深度学习框架、核心算法、平台、生态的 AI 全栈技术布局实现了更高程度的整合。

360 万开发者在用的飞桨:大幅降低应用门槛

AI 平台不仅要包含最先进技术的实现,还要能让人们以最简便的方式应用。百度大脑 7.0 升级的另一个重点是降低门槛。

飞桨是百度自研的深度学习开源开放平台,也是百度大脑的核心基座。通过飞桨,数百万开发者不再需要从头开始编写 AI 算法的代码,即可高效进行技术创新并应用于业务。机器学习门槛大幅降低,正在加快人工智能应用的多样化和规模化。

今年 5 月,飞桨升级到了 2.1 版,在训练速度、动态图功能、自定义算子、模型推理部署等方面有了全面升级。面对各行业众多场景需求,飞桨企业版采用了双平台的形式——EasyDL 零门槛 AI 开发平台和 BML 全功能 AI 开发平台,让不够精通人工智能算法的企业开发者能够像使用家电一样简单上手,专注于业务场景和创新。

EasyDL 让开发过程进一步简化,实现了端到端全流程的自动化,让开发者们在极简的用户体验下就能获得高精度的模型效果。

根据 IDC 今年上半年的报告,百度已成为国内深度学习平台市场综合份额第一。在世界大会上,百度公布了一组数字:目前,飞桨已累计拥有 360 多万开发者,他们来自于各行各业,通过飞桨平台,人们已经开发了超过 40 万个 AI 模型,累计服务了 13 万企事业单位,在各行各业都有飞桨在发挥作用。百度还宣布,这款深度学习框架最近已进入传统农业。

引领产业智能化,五年培养 500 万 AI 人才

今天的世界大会上,百度还带来了很多智能化转型的成功案例。

百度的智慧工厂解决方案和智能云服务,已经为很多企业的智能化转型打开了道路:为做好智能化治理水务工作,泉州水务集团与百度智能云达成战略合作实现了水处理厂的自动化和精简化,改善了居民的用水流程,覆盖当地 800 万人。

在智能交通云服务领域,百度 ACE 智能交通解决方案在场景及落地城市上不断扩展。2021 年 6 月,百度 ACE 智能交通签署千万订单的覆盖城市增加至 20 个,是去年同期的 4 倍。

百度智能云还与吉利控股签署战略了合作伙伴协议,开始提供私有云解决方案等云应用。

虽然成果已经显现,但产业智能化的过程还需要更多 AI 人才。

应用百度飞桨的 360 万开发者们,既有企业中的工程师,也有高校学生和老师。王海峰表示:「人才培养是一件需要长期投入的事,我们希望通过百度松果学堂为我国 AI 人才培养做出一点贡献。」

在提出「五年培养 500 万 AI 人才」计划之后,百度本次宣布正式成立百度松果学堂,这是一个面向产业实践的 AI 人才培养平台,将通过基础课程、技术竞赛、产业实训、科研基金等资源让人们更便捷地获取 AI 知识。

一边是降低门槛,一边是培养人才,百度正通过智能云加速 AI 技术落地爆发。

2006 年,百度办了第一届世界大会,到今天已是第十五年。不同于前沿研究「大力出奇迹」的方法论,AI 技术的落地需要更高的效率,更符合实际的定位。在这方面,长期在 AI 赛道前行,同时拥有先进技术的百度处在领先位置。

「让每一个人都感受到它带来的改变,这就是技术的价值。」李彦宏说道。

从图像分辨超越人类水平,打开深度学习视觉处理应用大门的 ResNet,到登上自然杂志,深远影响生物信息学领域的 AlphaFold,再到推动大规模预训练模型风潮,引领通用 AI 模型发展的 GPT-3…… 人工智能应用的方向越来越广,一面又正在面临空前复杂的问题。这需要 AI 平台既能帮助前沿技术突破,又能降低开发者应用门槛。

百度今天迈出的一大步,让我们看到了好的开始。
产业多模态学习深度学习李彦宏王海峰飞桨百度
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

增强现实技术

增强现实,是指透过摄影机影像的位置及角度精算并加上图像分析技术,让屏幕上的虚拟世界能够与现实世界场景进行结合与互动的技术。这种技术于1990年提出。随着随身电子产品运算能力的提升,增强现实的用途也越来越广。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统,是DeepMind在2017-2018年中一直在研究的项目,它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多,在生物学的核心挑战之一上取得了重大进展。

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
吉利机构

吉利汽车该公司亦为中国最大民营汽车生产企业浙江吉利控股集团有限公司的联营公司,自1997年进入轿车领域以来,已成为中国自主汽车品牌主要厂商之一。

http://global.geely.com/
推荐文章
厉害