构建中国自主AI工具包,WAIC开发者·临港人工智能开发者大会新锐开发者探讨痛点难题

随着第三波人工智能浪潮的兴起,全球人工智能进入高速发展的阶段。近年来,中国、美国、加拿大等国家纷纷把人工智能升级为国家级发展战略,尤其中美之间,人工智能技术发展竞争态势日渐激烈。

为了抢抓人工智能发展的重要战略机遇,中国已将人工智能上升为国家战略,加快建设创新型国家和世界科技强国。2017 年 7 月,中国颁布《新一代人工智能发展规划》,包含了研发、工业化、人才发展、教育和职业培训、标准制定和法规、道德规范与安全等各个方面的战略和发展目标,可谓是所有国家人工智能战略中最为全面的规划

在这样的时代背景下,上海市政府积极顺应趋势,颁布了《关于本市推动新一代人工智能发展的实施意见》,借助上海的产业基础、人才基础和赋能生态环境等优势,为上海人工智能产业发展提供了优渥的土壤。

为进一步贯彻落实习近平总书记“推动我国新一代人工智能健康发展”的重要指示,加快建设人工智能“上海高地”,构建国际一流人工智能产业生态,由世界人工智能大会组委会指导,上海市经济和信息化委员会、中国(上海)自由贸易试验区临港新片区管理委员会、上海临港经济发展(集团)有限公司主办的「WAIC 开发者·临港人工智能开发者大会」于12月6日在上海临港开幕。

作为WAIC开发者日的重要延续,该大会以开发者关心的话题为核心,设置了主题演讲、公开课、开发者工作坊、黑客松、技术和产业闭门研讨会等环节,为全球优秀的人工智能开发者们提供一个学术交流、技术探讨和沟通合作的平台。

在上午的主题演讲环节,商汤科技联合创始人兼 CEO 徐立、依图科技联合创始人林晨曦、谷歌研究科学家/普林斯顿大学计算机科学系教授 YoramSinger、南京大学人工智能学院教授俞扬等来自AI领域的重磅嘉宾为参会者们分享了不同的技术主题。而之后的新锐开发者对话环节,也是上午主会议的另一大亮点。

人工智能新锐开发者对话环节,华为开源生态主任工程师黄之鹏和领规科技创始人黄康两位开发者代表围绕「中国自主的AI工具包」这一热门话题展开了讨论。

随着中美在AI方面的竞争愈发激烈,中国AI基础设施建设方面的现状和发展问题,也引发了越来越多的关注和讨论。很多业内人士认为,目前国内有很多AI公司都取得了商业上的成功,但在底层核心技术方面,中国公司依然非常依赖美国的AI工具包,以深度学习框架为例——谷歌TensorFlow框架和Facebook的Pytorch框架最为流行。这个问题被视为中国AI生态系统的一大缺口。

黄之鹏目前担任华为开源生态主任工程师,负责开源团队,并参与了OpenStack、Kubernetes、CNCF、ONNX、MLSpec、OpenSDS、Akraino等开源社区的系列工作。他表示,「AI工具包都在美国手里」这个命题其实是有问题的,因为大众所理解的AI工具包是狭义的,比如说深度学习框架TensorFlow、Pytorch,但实际业界在做人工智能研发时所用到的工具包是远远超过这个的。例如,我们编译用的编译器,更广泛意义上,刚才讲的强化学习模拟器,这些可能会用到很多新的工具。从这个意义上来说,我们不是弱,是弱了很多,我们看到大量的包都不是源自中国。」

而中国在构建AI生态方面,是不是把所有的软件自己写一遍就解决问题了?其实不是的。黄之鹏认为,很多思路是静态的,从静态的角度补齐软件,不是类别齐全就可以的。其实AI生态的建立是一个动态发展的过程,对中国开发者来说,我们差在能够像TensorFlow、PyTorch这样讲一个全球性AI工具的故事,怎么建立一个以中国开发者为主但是面向全球的社区,这个是我们在开源这块做得不太足的地方。

黄康是北京航空航天大学博士,也是领规科技的创始人。领规科技主要致力于全球语种智能助手和端侧AI 数据智能技术产品,拥有多名Google TensorFlow Lite 和Kaldi 项目Contributor。

黄康博士非常赞同黄之鹏的观点,他认为完整的AI工具包应该是非常大的,今天我们可能看到最热门的工具包是PyTorch和TensorFlow。但是工具包也处在一个飞速的发展过程中,他相信随着大家开源意识越来越好,知识越来越多,包括经费和人才的加入,未来肯定会有所超越。

而回到议题本身,在今天的时代背景下,我们应该怎么建设中国自有的AI工具包?

黄康表示:第一,我们要对来自于国外的工具包非常熟悉,甚至知道里面的运行原理是怎么回事,这样才能结合目前已有的工业化、产业化的场景去做很好的适配。

第二,除了工具包之外,专利可能是一个更加严重的问题,因为我们知道在过去的2-3年间,谷歌发布了关于深度学习基础算法或者理论框架的专利,这个专利可能会影响我们整个后续包括工具包的使用,

黄之鹏则表示,国外的开源社区(TensorFlow、PyTorch)也并不是都能达到所谓的完美状态,比如TensorFlow 2.0的发布犯了开源社区的大忌——不是互相兼容的,很多用户被晒在那里,还停留在1.6、1.8的版本,所以说国外主流的开源社区也是在一步一步走。除了华为的技术能力之外,包括明年会开源的MindSpore,自己也会负责社区运营,做一个好的社区生态,其实是非常重要的。

第二,专利是现在大家误区非常多的一个地方,国内做开源原动力不太足,大家一提到开源,反应就是这个东西扔出去了,白做了,其实不是的。即便是最友好的一些开源工具,也规定了在一定的时间和空间程度上的授权。像黄康老师说的一定要注意专利的编写,我们也要好好地写这个专利。

此外,「易用性」也是开发AI工具包要特别注重的特性。

有多年企业开发经验的黄康表示,「对要做开源社区或者是开源工具的开发者小伙伴来说,一定要把产品的应用性放在一个特别好的位置。」

同样,从工程角度来说,华为一直非常重视易用性问题。黄之鹏说,「等到MindSpore明年Q1开源出来之后,可以支持一键动态图和静态图的切换,我们做了很多的抽象,帮助开发者尽可能地减少学习曲线。相比之外,TensorFlow学习曲线是比较陡的,尤其是在2.0版本推出以后,这条曲线变得更陡。」

最后,两位新锐开发者都认为在AI生态的建设中,除了业界,高校力量也是重要一环,应该起到表率作用。国内也应该大力支持中国开发者创新,构建中国自主的AI工具包。

产业临港大会AI工具包
1
相关数据
依图科技机构

依图科技是全球极少数拥有全栈AI核心自研技术的创新企业,在计算机视觉、语音识别、语义理解、智能决策、AI芯片等领域达到全球领先水平,是国内唯一具有提供超大规模、复杂环境下亿级规模城市的智能化运营管理技术能力的AI公司。

https://www.yitutech.com/
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商,致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。目前华为有19.4万员工,业务遍及170多个国家和地区,服务30多亿人口。

https://www.huawei.com/cn/
商汤科技机构

作为全球领先的人工智能平台公司,商汤科技SenseTime是中国科技部指定的“智能视觉”国家新一代人工智能开放创新平台。同时,商汤科技也是全球总融资额及估值最高的人工智能创新企业。 商汤科技以“坚持原创,让AI引领人类进步”为愿景。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为亚洲最大的AI算法提供商。 商汤科技在多个垂直领域的市场占有率位居首位,业务涵盖智能手机、互联网娱乐、汽车、智慧城市、以及教育、医疗、零售、广告、金融、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的企业和机构建立合作,包括本田、SNOW、阿里巴巴、苏宁、中国移动、OPPO、vivo、小米、微博、万科、融创等。

http://www.sensetime.com
黄康人物

黄康,Kika CTO,负责全球技术团队的组建管理和技术架构的搭建,北京航空航天大学博士,主要专业领域为人工智能与机器学习。在国内外学术刊物发表论文 10余篇,国内外多个 SCI 和 EI 源刊审稿专家,获得发明专利 4 项。曾任中国科学院某国家重大科技专项系统主管设计师,豌豆荚广告算法与搜索推荐工程团队负责人。

俞扬人物

博士(导师为周志华),南京大学副教授,南京大学机器学习与数据挖掘研究所(LAMDA)成员。主要研究领域为人工智能、机器学习、演化计算、数据挖掘。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

学习曲线技术

在机器学习领域,学习曲线通常是表现学习准确率随着训练次数/时长/数据量的增长而变化的曲线

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

推荐文章
暂无评论
暂无评论~