张倩作者

谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨

AI 技术需要开源、开放,对于这一点,产学研各界已经达成了共识,政府也在全力支持国内开源生态的建设。

长期以来,开源开放的研究氛围一直是促进人工智能领域发展的关键因素。正是因为学界和业界参与者不断和快速地公开自己的研究结果和代码,人们才能够及时掌握相关方向的最新进展,并在学术环境之外开展自己的研究。

百度与中国科协学会学术部共同主办的 2020 中关村论坛——AI 开源创新与产业智能化平行论坛上,开源、开放再次成为了中心话题。在这次论坛中,中国工程院院士、浪潮首席科学家王恩东,百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰,百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜,小米集团副总裁、小米集团技术委员会主席崔宝秋,天津飞腾信息技术有限公司副总经理张志群等十余位产学研各界顶级专家带来了 AI 开源生态构建、产业智能发展趋势以及自主核心 AI 技术应用价值成果的深度分享。


在谈到开源创新为何如此重要时,王海峰表示,人工智能高速发展,已成为新一轮科技革命和产业变革的重要驱动力量。这其中,人工智能技术的开源创新起到了很大的作用。一方面,开源创新可以加速技术的创新发展,不断拓展人类认知边界和技术边界;另一方面,所有开发者都可以基于开源开放的成果开发自己的项目、产品及业务,更便捷、高效、安全地推进技术创新与应用。

百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰在论坛中致辞。

2012 年,AlexNet 的成功吸引了学术界和工业界对于深度学习的广泛关注。如今,深度学习已经成为 AI 研究的主流方法。在这场产业智能化升级之战中,深度学习自然也成了「商家必争之技」。然而,深度学习应用的高门槛也让很多企业望而却步,很多工作都是在「重复造轮子」,创新无从谈起。

作为「智能时代的操作系统」,开源深度学习平台的出现彻底改变了这一现状。

开源开放的深度学习平台有效地降低了深度学习技术应用门槛。作为百度自主研发、国内最早开源开放、功能完备的产业级深度学习平台,飞桨一直备受瞩目,而且已经大规模应用于通信、电力、城市管理、工业、农业、林业等众多关乎国计民生的领域,加速推动千行万业实现智能化。

在这次论坛中,吴甜做了主题为「飞桨推动产业智能化之路」的演讲,系统介绍了开源开放的飞桨在产业智能化升级大潮中所扮演的重要角色。

百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜在论坛中演讲。

长期致力于小米技术研究与应用的崔宝秋也在本次论坛上分享了他的观点《智能新时代 拥抱开源》。他指出,云计算与大数据时代离不开开源,AI时代更是与开源相互促进。

小米集团技术委员会主席崔宝秋在论坛中演讲。

飞腾公司副总经理张志群发表了题为《飞腾芯算力 智能新引擎》的演讲。他表示,新基建带来了万亿级市场,也为产业智能化升级带来许多机会,更给信息产业提出了算力、协同、安全、应用这四大考验。其中,自主可信、内生安全,是新基建的运行保障;开放联合、应用创新,是新基建的落地关键。

天津飞腾信息技术有限公司副总经理张志群在论坛中演讲。

国内首个开源开放的产业级深度学习平台——百度飞桨

飞桨是百度自主研发,国内首个开源开放、技术领先、功能完备的产业级深度学习平台,2016 年正式开源。

深度学习模型开发、训练、预测和部署等方面,飞桨已可比肩 TensorFlow、PyTorch 等国际主流框架,并在多项技术上有优于后者的表现,打破了国内的 AI 开发者过度依赖国外开源深度学习框架的局限,有助于进一步培育自主可控的 AI 产业生态。

在论坛中,吴甜介绍说,飞桨目前有四个方面的领先技术:开发便捷的产业级核心框架、支持超大规模深度学习模型训练、多端多平台部署的高性能推理引擎以及覆盖多领域的工业级模型库。

最近,飞桨又迎来全新升级。从技术层面出发,此次更新可形容为「动静统一、软硬融合」。在硬件上,飞桨目前已适配 22 种芯片型号,覆盖 15 家硬件厂商,对国产硬件的支持超过 TensorFlow 和 PyTorch;软件上,动态图功能升级实现了动静态的结合,让用户更容易开发模型;全面升级的 API 体系,则对于开发者更加友好。目前,飞桨可以与华为等硬件进行深度配合,让 AI 应用收获更强劲的效果,加速人工智能技术的进一步普及。

如今,飞桨已经应用到金融、工业、城市治理等多个领域。

在金融风控领域,使用飞桨可以将信贷风险判断准确率提升 21%,飞桨中的语义理解模型 ERNIE 通过学习大量的文本和知识实现了语义理解性能的大幅提升。

计算机视觉领域,飞桨已经开始助力工业质检,比如笔记本外壳检测、总装车灯检测,帮助工厂在大面积的产品或小部件中找出微小的瑕疵。

在智慧城市中,飞桨可以应用于城市治理、施工车辆追踪,车辆违章监测等场景。



飞桨的成功秘诀:开源

和 AI 领域的其他技术一样,飞桨的成功,自然也离不开开源。

作为开源软件,飞桨一直在建设开源社区。目前,飞桨已经凝聚了 230 万开发者,创造了 31 万个模型,项目数量总体超过 4.7 万,并且有多个项目登顶各大榜单。飞桨推出的飞桨开发者 PPDE 计划也共建了开源社区,组建了 22 个飞桨地方社群,100 多个高校社群。

开源给飞桨的开发所带来的益处良多。

首先,开源的环境对平台的开发提出了更高的要求。开源以后,社区里的开发者非常多,工程师把代码亮出来以后,大家都能知道你是如何设计的,以及你的代码、文档有没有问题。这就对整个编程的易用性、API 的完备性提出了新的要求,这些要求以前在不做开源时不会考虑太多。

其次,开源是帮助构建生态的良好方式。深度学习框架的上下游生态非常复杂,需要和芯片、计算机系统做对接。在飞桨开源的生态系统中,第三方生态贡献扮演了很重要的角色。在飞桨这个项目中,很多的开发不是百度工程师做的,还有其他人在基于这个做出新的项目和更多的贡献。

在论坛中,王海峰表示,百度十年以前开始全面布局人工智能的时候,就是本着开源、开放的精神。早在 2012 年,百度就开放了翻译的 API。如今,百度翻译每天的翻译量已经达到了 1000 亿字符。2013 年,百度又开放了语音平台,现在每天的调用量超过 150 亿。

2016 年,在开源飞桨的同时,百度也开放了百度大脑的很多 AI 能力。发展到今天,百度大脑每天的调用量超过 1 万亿,很多开发者都在使用这些工具推动自己的业务。

与此同时,企业对于开源的拥抱程度也是在持续增加的。

一方面,企业自身所开发的软件平台、工具正在进行越来越多的开源工作,有 95% 的受访者认为企业开源是至关重要的。另一方面,企业在使用开源软件的时候,预期也在一直在发生变化,77% 的受访者表示他们希望增加对企业开源软件的使用。这些都说明,开源社区是在持续发展的,这反过来又会促进飞桨等开源平台的发展。


核心问题:如何建好生态?

在主题演讲之后,百度深度学习技术平台部高级总监马艳军主持了一场围绕「AI 开源创新赋能产业发展」话题的高峰对话。工商银行大数据人工智能实验室副总经理黄炳、中国联通研究院人工智能总监廖军、中车研究院智能产品负责人田寅、Gartner(高德纳)研究咨询高级总监张桐、百度 AI 技术生态部总经理刘倩等嘉宾展开深度的行业交流。

田寅表示,开源工具在传统企业发挥着非常重要的作用,它们可以帮大家更快地上手深度学习,更快地领悟到新技术。廖军认为,这种好处其实是双向的,在开源工具赋能传统行业的同时,后者其实也充当着贡献者,在用的过程中发现问题,帮助开发者打磨这些工具,双方一起建设一个完善的生态。

在整个论坛中,「生态」都是一个高频词,开源本身就是要建立一个生态体系。那么,如何建好这个生态体系,找到利益互通的点,避免恶性的竞争是一个值得思考的问题。 

张桐认为,在数据方面,我们需要用联邦学习等技术解决数据孤岛问题,让数据真正为我所用;在算力方面,要建立一种共享机制,帮助中小企业用上 AI。

对于数据孤岛问题,黄炳补充说,其实行业里面关于联邦学习的产品不是没有,而是过多。因此眼下的问题其实是联邦学习缺乏规范性。他认为,要让中小企业用上 AI,核心其实是搭建平台,把中小企业接触 AI 的门槛降下来。

众嘉宾表示,目前业界开源生态与环境正在随着 AI 大规模落地的进展快速构建。在业务实践中,类似飞桨这样成熟可靠,已被大量产业级应用验证的开源平台,不仅为技术开发和企业创新不断降低着门槛,更为整个产业智能化升级不断加速。

「AI 开源创新赋能产业发展」 高峰对话。

对于百度做开源的核心思路,百度 AI 技术生态部总经理刘倩解释说:「做开源开放的时候,我们有一个非常明确的判断,就是人工智能最后的产业级应用一定不是由某一家企业来主导完成的,最后一定会形成一个角色分明、上下游的这样一个产业级的生态。所以从那个时候开始,我们去分享开源平台,去做百度大脑开放平台,其实都是在做最底层的基础设施,希望能够给各行各业提供从数据、算法、工具到平台的支持。」

在对话现场,Gartner 还发布了最新调研报告《飞桨推动中国产业智能化之路》,从深度学习趋势判断方面着重分享了飞桨在推动中国产业智能之路中形成的自我定位、技术优势、技术布局以及生态布局等。
 
Gartner 报告下载链接:https://www.gartner.com/technology/media-products/pdf.jsp?g=Baidu-1-242L3UMH-CHS

开源开放,是人工智能发展的重要趋势之一。研究和发展技术领先、功能完备、自主可控的核心技术对于推动我国技术创新、产业发展和人才培养等都具有至关重要的作用。本次「AI 开源创新与产业智能化」平行论坛不仅展示了产业级深度学习开源平台在人工智能领域带来的创新和赋能,更展示了中国 AI 系统建设与生态发展的速度与新思路。

参考链接:
https://baijiahao.baidu.com/s?id=1674870214107274652&wfr=spider&for=pc
https://m.gmw.cn/baijia/2020-09/17/34197260.html
产业吴甜王海峰百度飞桨百度AI
相关数据
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商,致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。目前华为有19.4万员工,业务遍及170多个国家和地区,服务30多亿人口。

https://www.huawei.com/cn/
崔宝秋人物

现为小米首席架构师、小米云负责人。美国纽约州立大学石溪分校计算机科学系博士。2000 年至 2006 年任 IBM 高级工程师和高级研发经理,负责 DB2 数据库优化和内核总控等核心模块的研发;2006 年至 2010 年任雅虎搜索技术(YST)核心团队主任工程师,参与了雅虎搜索引擎的热门搜索、查询优化和新一代查询缓存等重要项目的研发;2010 年至 2012 年任 LinkedIn 主任工程师,开始接触社交网络,并负责 LinkedIn Signal(内容搜索)的研发,期间作为创始团队之一开源了 SenseiDB,一个分布式实时搜索系统;2012 加入小米科技有限责任公司,任首席架构师和小米云负责人。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

推理引擎技术

推理机是实施问题求解的核心执行机构,常见于专家系统。它是对知识进行解释的程序,根据知识的语义,对按一定策略找到的知识进行解释执行,并把结果记录到动态库的适当空间中去。

百度机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

https://www.baidu.com/
联邦学习技术

如何在保护数据隐私、满足合法合规要求的前提下继续进行机器学习,这部分研究被称为「联邦学习」(Federated Learning)。

小米集团机构

小米公司正式成立于2010年4月,是一家专注于智能手机自主研发的移动互联网公司,定位于高性能发烧手机。小米手机、MIUI、米聊是小米公司旗下三大核心业务。“为发烧而生”是小米的产品理念。小米公司首创了用互联网模式开发手机操作系统、发烧友参与开发改进的模式。2018年7月,工业和信息化部向与中国联合网络通信集团有限公司首批签约的15家企业发放了经营许可证,批准其经营移动通信转售业务,其中包括:小米科技有限责任公司。 2018年7月9日,正式登陆香港交易所主板 。

https://www.mi.com/
推荐文章
暂无评论
暂无评论~