杜佳豪编辑

旷视天元Beta版核心细节首次揭秘,2020 WAIC开发者日「深度学习框架与技术生态论坛」举办

今年 3 月,旷视科技开源了在内部工程实践超过 6 年的深度学习框架天元(MegEngine),其「训练推理一体」、「动静合一」、「兼容并包」、「灵活高效」的强大性能,为 AI 领域带来了新的风向。

秉承开放、高效、合作、共赢的态度,一方面旷视希望将最佳实践反哺业界,另一方面也希望更多开发者共同参与MegEngine的使用、建设和改进,打造国内深度学习领域的繁荣生态。

7月11日,在旷视科技和机器之心联合举办的2020 WAIC开发者日「深度学习框架与技术生态」分论坛上,旷视天元MegEngine深度学习框架Beta版正式发布。此外还邀请了多位行业专家和技术生态合作伙伴,对目前国内深度学习框架技术发展的思想、脉络和现状进行了全面深入分析。

image.png

旷视研究院高级技术总监田忠博首先分享了「天元深度学习框架的创新与探索」。天元是旷视从2014年开始自主研发的深度学习框架,目前天元框架支撑着旷视所有的算法的训练和推理。今年3月,旷视在将天元深度学习框架正式开源的同时,也推出了Brain++商业化版本。

田忠博介绍说,自从开源以来,在众多优秀开发者、院校以及企业机构的积极参与下,整个天元生态仓库有了长足的进步,共收获了2400多个Github Star,达到1000多次的下载量。

现在,旷视天元Beta 版也已经正式发布。在本场论坛论坛上,旷视研究院AI系统高级技术总监许欣然对其进行了深入的技术与特性解读。

一是推理功能方面的全面优化,天元Beta版本在ARM上面使用了全新的优化的NCHW44的张量排布;二是实现从训练、量化、推理的一站式的完整流程。这样的体验能够帮助开发者把自己的精力更多的集中在算法的研发上、更多的集中在业务和场景中,而使得大家能够从繁琐的流程、繁琐的性能优化和模型复现中解放出来,真正的关注最能够为大家提供价值的部分。

作为旷视技术生态合作伙伴的代表,小米AI实验室高级软件工程师卢旭辉分享的主题是「MACE—面向AIoT的深度学习推理框架」。小米是一个以AIoT设备为主要产品的公司,端侧的、设备端的深度学习推理框架是至关重要的,这也是开发MACE的初衷。MACE是一个面向AIoT的深度学习推理框架,拥有手机端AI引擎和微控制器MACE  Micro AI引擎。支持多种框架在设备端的异构计算加速,也支持高通、MTK等主流厂商的芯片。近期,小米也与旷视合作对天元训练引擎进行了支持,通过天元训练出的模型可通过MACE部署到设备端。

另一位旷视技术生态合作伙伴代表、Open AI Lab计算框架Tengine产品负责人程实分享了「嵌入式深度学习框架的现状发展与TEngine实践」。

TEngine是Open AI Lab的核心产品,是一款嵌入式边缘侧的AI计算框架,与众多国内芯片公司有着深度的合作关系,致力于打造AIoT底层生态圈,为AIoT应用开发者提供加速部署的工作流,帮助开发者加速面向场景的AI算法在嵌入式终端/边缘端上的快速迁移。他提到,一个嵌入式AI框架首先要解决的是AI推理问题,二是预训练模型能否部署到目标平台上,这是判断一个框架实用性的两点重要因素。

除了上述深度学习框架层面的业界实践之外,中科院计算所高性能计算机研究中心主任、博士生导师谭光明也介绍了旷视天元在学界的应用场景。

谭光明提到,目前AI已经成为高性能计算领域里面非常重要的场景之一,同时深度学习技术对此类算法的优化也成为了重点关注的话题。从2013年开始,利用GPU来加速深度学习已经成为非常明显的趋势,单节点GPU训练也越来越多地向多节点GPU训练转变,国内外的深度学习框架都在朝此方向转变。基于旷视的天元框架,谭光明团队已经提出了可变Batch—size、Data layout自动调优、All—Reduce三个算法,提高了整体工作的扩展性和训练效率。

最后,来自旷视内部的两位资深工程师为大家分享了「基于天元开源深度学习框架的旷视算法SDK工程优化实践」,分别是旷视服务器算法SDK高级架构师高鹏远旷视嵌入式算法SDK研发负责人武庚晨

2020世界人工智能大会云端峰会(WAIC2020)于7月9日-11日在上海举行。作为此次大会期间唯一面向 AI 技术人员和开发者的专业活动,WAIC 开发者日共设置主论坛、分论坛、高峰对话、开发者日百度公开课、开源开放 Demo Day、黑客马拉松等多个环节。

7月11日上午,开发者日4场分论坛与开发者日百度公开课已圆满落幕,欢迎大家继续关注下午的主论坛内容。

产业WAIC
相关数据
Qualcomm机构

高通公司(英语:Qualcomm,NASDAQ:QCOM)是一个位于美国加州圣地亚哥的无线电通信技术研发公司,由加州大学圣地亚哥分校教授厄文·马克·雅克布和安德鲁·维特比创建,于1985年成立。两人此前曾共同创建Linkabit。 高通公司是全球3G、4G与5G技术研发的领先企业,目前已经向全球多家制造商提供技术使用授权,涉及了世界上所有电信设备和消费电子设备的品牌。根据iSuppli的统计数据,高通在2007年度一季度首次一举成为全球最大的无线半导体供应商,并在此后继续保持这一领导地位。其骁龙移动智能处理器是业界领先的全合一、全系列移动处理器,具有高性能、低功耗、逼真的多媒体和全面的连接性。目前公司的产品和业务正在变革医疗、汽车、物联网、智能家居、智慧城市等多个领域。

http://www.qualcomm.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

百度机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

https://www.baidu.com/
旷视科技机构

北京旷视科技有限公司是一家行业领先的人工智能公司,在深度学习方面拥有核心竞争力。旷视向客户提供包括先进算法、平台软件、应用软件及内嵌人工智能功能的物联网设备的全栈式解决方案,并在多个行业取得领先地位。2017年和2019年,旷视跻身《麻省理工科技评论》发布的两项「50大最聪明公司」榜单中。 旷视是全球为数不多的拥有自主研发深度学习框架的公司之一,旷视自研的深度学习框架MegEngine作为旷视人工智能算法平台Brain++的核心组件,为算法训练、部署及模型改进过程提供重要支持。 旷视总部位于北京,拥有 2,000 多名员工,并在北京、上海、南京、成都等地都设有研发中心。旷视的典型客户包括金融科技公司、银行、智能手机公司、第三方系统集成商、物业管理者、学校、物流公司及制造商等。

https://www.megvii.com/
机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
小米集团机构

小米公司正式成立于2010年4月,是一家专注于智能手机自主研发的移动互联网公司,定位于高性能发烧手机。小米手机、MIUI、米聊是小米公司旗下三大核心业务。“为发烧而生”是小米的产品理念。小米公司首创了用互联网模式开发手机操作系统、发烧友参与开发改进的模式。2018年7月,工业和信息化部向与中国联合网络通信集团有限公司首批签约的15家企业发放了经营许可证,批准其经营移动通信转售业务,其中包括:小米科技有限责任公司。 2018年7月9日,正式登陆香港交易所主板 。

https://www.mi.com/
量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~