Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

杜伟报道

技术、生态和产业齐头并进,AI发展进入「深度学习+」阶段

自人类进入工业社会以来,每次工业革命的背后都离不开核心技术的驱动,正如机械技术、电气技术和信息技术之于前三次工业革命。如今在第四次工业革命进程中,AI 正成为核心驱动力,而深度学习是关键核心技术。

深度学习具有很强的通用性,它呈现出的标准化、自动化和模块化特征,逐渐推动 AI 进入工业大生产阶段。作为快速便捷构建、训练和部署 AI 应用的基石,深度学习平台的重要性更是日益凸显,通过降低 AI 应用门槛,将 AI 技术传递给千行百业,推动 AI 应用大规模落地。随着 AI 与产业结合的不断深入,规模化的 AI 大生产已然形成。

深度学习蓬勃发展的过去十余载,业界持续发力。作为国内 AI 领域的领头雁,百度一直以来深耕深度学习技术,推出自研产业级深度学习开源开放平台飞桨,集核心框架、产业级模型库、开发套件与工具组件于一体。飞桨核心框架更与全球两大主流深度学习框架 TensorFlow、PyTorch 形成三足鼎立。依托飞桨平台,百度围绕技术、生态和产业做大做深,构建了全方位、多层次的深度学习发展格局。

随着规模化 AI 大生产的形成,百度敏锐观察到 AI 的技术创新和产业发展正进入一个新的阶段。1 月 10 日,在百度 Create AI 开发者大会上,百度 CTO 王海峰提出「深度学习 +」概念,在 AI 领域的探索迈出全新的一步。类似「互联网 +」,利用信息通信技术以及互联网平台,让互联网与传统行业进行深度融合。进入「深度学习 +」阶段,业界不仅要注重深度学习技术的丰富与增强,还要着眼于整合打通上下游生态以及加强对各行各业的深度赋能。

图片

具体来讲,「深度学习 +」要从三个角度来理解,分别是技术、生态和产业。技术角度为深度学习 + 知识,知识增强的深度学习是 AI 技术进一步发展的重要方向;生态角度为深度学习 + 上下游生态伙伴,芯片、框架、模型及应用构成深度学习的良性生态;产业角度为深度学习 + 千行百业,利用深度学习技术变革生产方式,加速产业智能化升级。

可以看到,「深度学习 +」覆盖了从技术融合、生态构建以及产业联动的方方面面,为实现更全面、更深入的深度学习驱动型 AI 技术创新和产业发展打好了基础。在会上,百度 CTO 王海峰表示,「深度学习 + 是创新发展新引擎,驱动技术发展和产业增长,让创新创造大有可为。

图片

进入「深度学习 +」阶段,AI 行业已经做好了准备

其实,「深度学习 +」阶段并不是一蹴而就的,它的到来有着深厚的历史积淀。

首先,在 AI 领域,自 2012 年以 AlexNet 为代表的开创性研究出现以来,深度学习方法逐渐成为主流,推动 AI 应用进入爆发期。并且,以卷积神经网络、循环神经网络和对抗生成网络为代表的一系列深度学习算法持续在自然语言处理计算机视觉等关键领域取得巨大进展。

在这期间,AI 的融合创新越来越丰富,跨模态多技术融合、软硬一体融合以及技术与场景融合趋势愈加明显。深度学习技术的研发、调整和落地过程中充分考虑到了大规模丰富知识的加入,如知识图谱、领域知识、行业知识等,知识驱动成为深度学习的重要特征之一。如此一来,我们能够更好、更准确地将深度学习技术与应用场景融合,达到更好的应用效果。

因此,从整个行业的阶段发展来看,深度学习 + 知识是 AI 技术进一步发展的重要方向。知识凝炼了人类认识和改造世界的智慧,让机器从海量数据和大规模知识中融合学习,可以使得知识增强的深度学习效果更好、效率更高、可解释性更强。

其次,生态建设是在技术融合和落地过程中联动各方的关键步骤,对 AI 尤其深度学习技术而言亦是如此。过去多年,AI 行业不断围绕深度学习平台拓展开源生态,与硬件厂商合作搞好芯片的适配与优化,加强与各类企业、开发者的联系,覆盖更多行业领域。此外产学研各方携手培养 AI 人才,为深度学习技术的普及提供坚实的人才支撑。至此深度学习的生态雏形已经形成。

为了建设更持久的生态,深度学习技术要继续联动上下游生态伙伴,通过芯片、框架、模型和应用构成深度学习的良性生态

芯片层,支持深度学习训练、推理的丰富芯片与深度学习框架软硬联合优化,更好的性能和更高的效率提供了强大算力;在框架层深度学习框架支持便捷开发、高效训练和多端多平台推理部署,提升模型研发效率及效果;在模型层,提供契合产业需求的深度学习模型,通过支持低或零代码的开发套件和工具组件降低应用门槛;在应用层深度学习技术与场景融合创新,加速产业智能化升级,催生新业态新模式,实现生产力跃升。

最后,产业赋能是深度学习技术实现自身价值的最终手段,这点也在其发展进程中得到验证。凭借强大的能力,深度学习技术已经在自然语言处理、视觉识别、推荐引擎、翻译软件、虚拟助手、机器人、自动驾驶以及更多其他领域实现了应用落地,深层次地改变了人们的生产生活方式。

未来,深度学习技术要深入到千行百业,实现降本增效,创新产品和业务,加速产业智能化进程,努力实现高质量增长。

可以看到,过去整个 AI 行业一步步地向着「深度学习 +」这一阶段迈进,并通过深度学习平台和大模型技术加速了这一进程。随着技术、生态和产业方面的铺垫,AI 技术创新和产业发展进入新阶段变得水到渠成。

内部持续积累沉淀,百度为「深度学习 +」蓄势已久

对于百度而言,「深度学习 +」早已在内部生根发芽、茁壮成长。百度当前的深度学习布局催生了这一概念,尤其是飞桨以及依托飞桨打造的文心产业级知识增强大模型,它们为百度推动 AI 技术创新和产业发展的新阶段提供了信心和底气。

用知识学习增强大模型能力、拓展大模型落地

在百度,飞桨深度学习平台 + 文心大模型已经成为核心发展模式,并以此构筑了产业智能化基座。此次技术角度的 “深度学习 + 知识” 在文心大模型的一系列发展中得到实践验证,并收到了显著的成效。2019 年开始,百度深耕预训练模型研发,先后发布知识增强文心(ERNIE)系列模型。文心系列模型基于持续学习的语义理解框架,从大规模知识和海量数据中融合学习,效率更高,效果更好。2021 年 12 月,ERNIE 3.0 升级为全球首个知识增强千亿大模型鹏城 - 百度・文心,同时,产业级知识增强大模型文心全景图亮相。文心大模型在历次升级中持续加强知识增强,使之成为与产业级并列的两大核心特色之一。

图片

文心大模型全景图。

我们以文心 ERNIE 为例,其框架不断从不同数据和知识中学习并构建新任务。通过从不同任务中持续学习,大模型能力持续提升,拥有更多知识。ERNIE3.0 首次在百亿级预训练模型中引入大规模知识图谱,从大规模知识图谱和海量无结构数据中学习,使大模型具备更强的知识记忆和推理能力。相较于没有知识增强的大模型,文心大模型的学习效率更高,在实体问答、知识预测、可控文本生成等多个场景上具有更好的效果

图片

文心 ERNIE 能够准确地完成知识问答任务。

知识增强使得包括文心 ERNIE 在内的文心大模型具备跨模态、跨语言的深度语义理解与生成能力。此外,在百度文心大模型体系中,行业大模型是非常重要的特色,成为推动大模型产业化落地和促进行业智能化升级的重要手段。通过行业知识增强,文心行业大模型充分挖掘和建模特定行业场景中的大量行业数据和知识,同时引入行业实际业务积累的特有知识,增强对行业应用的适配性,取得很好的效果。

图片

百度文心行业大模型。

围绕飞桨平台凝聚各方智慧、构建良性生态

百度飞桨生态建设经过多年的发展,已经形成向下、向上两条路径,构筑了全面的生态发展格局,实现了芯片、框架、模型和应用层面的高效衔接与互通。

图片

飞桨全景图。

深度学习平台向下,飞桨与广大硬件生态伙伴合作,通过技术共研开拓更多软硬件协同产品和功能,形成合作共赢的生态。目前已有超过 30 家硬件厂商与飞桨深度融合优化,国内外主流芯片基本都已适配飞桨。飞桨在 2022 年携手硬件合作伙伴开启硬件生态共创计划,并联合 12 家硬件伙伴推出飞桨生态发行版。

向上,飞桨着力广泛的应用生态。一是企业生态,通过 AI 快车道等多种方式让前沿技术深入业务场景,有针对性地为中小和大型企业生态伙伴提供多样化技术能力和服务。二是教育生态,联合高校构建产教融合的 AI 人才培养体系。三是开源生态,与业界优秀的开源社区和开源项目合作,联合开发者和开源社区共建深度学习开源生态。

深度学习平台 + 大模型构筑产业智能化基座

一直以来,百度都高度重视产业赋能,并在飞桨深度学习平台和文心大模型的发展中践行着这一点。

一方面,飞桨始终坚定平台的产业级特性,贴近产业实践。通过飞桨平台,企业可以快速便捷地开发适合自身业务场景的优化算法,在实践中更早地部署 AI 能力。另一方面,文心大模型尤其行业大模型寻求与企业场景需求的契合,加速 AI 落地。不断壮大的文心行业大模型持续扩大覆盖行业的范围,在产业化落地过程中使大模型真正赋能千行百业。

我们以 “深度学习 + 交通” 融合创新的智能应用 —— 智能交通中的「智能调度系统」为例,通过图神经网络强化学习技术,实现整个区域交通流量的全局调控,最大限度减少各方向绿灯的空放,减缓道路拥堵,节省出行时间。这套系统已在北京亦庄、长沙、保定等地上线。

图片

路口信号灯配时智能优化。图源:Apollo 智能驾驶

深度学习 +」未来可期,各方要百尺竿头更进一步

毋庸置疑,在「深度学习 +」这个 AI 技术创新和产业发展的全新阶段,各方都迎来了一个良好的契机,能否把握住变得尤为重要。

对于百度而言,其持续深化的飞桨深度学习平台以及日益完善的文心大模型体系贯通了从硬件适配、模型训练、推理部署到场景应用的全产业链,成为「深度学习 +」驱动技术创新和赋能产业发展的引擎。未来要继续释放飞桨平台和文心大模型的引擎力,更快更好更广地开拓深度学习技术,并力求更大范围的应用落地。

对于产业合作伙伴而言,接入并利用深度学习平台和大模型技术,结合自身具体业务需求,能够不断提升业务智能化水平,实现业务效率提升和高效增长。

对于整个 AI 行业而言,应更加重视深度学习的技术红利,充分发挥潜力,实现新的 AI 技术突破,拓宽应用广度和深度,完成其变革社会生产生活方式的历史使命。

从更宏大的视角来讲,「深度学习 +」对于我国现代化产业体系也将产生助益。我国品类齐全、体量庞大的产业体系将为深度学习驱动的创新提供丰富的应用场景,有助于形成良性循环,促进底层技术突破,进一步升级我国现代化产业体系,全面推动经济社会进入智能时代。

总之,「深度学习 +」未来可期,各方要百尺竿头更进一步。百度显然已经为此做好了准备,继续发挥领头雁的表率作用,引领 AI 未来发展。

参考内容:
https://www.geekpark.net/news/302263
https://ai.baidu.com/support/news?action=detail&id=2897


入门深度学习+
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

文本生成技术

文本生成是生成文本的任务,其目的是使人类书写文本难以区分。

推荐文章
暂无评论
暂无评论~