林亦霖校对文婧 编辑

美国AI战略出炉,释放了这些信号!

一、《美国人工智能倡议》释放重要信号

2019年2月11日,美国国家科技政策办公室发布了由总统特朗普签署的《美国人工智能倡议》(American AI Initiative,以下简称《倡议》)。在白宫网站上,《倡议》被视为“行政命令”并以《维护美国人工智能领导力的行政命令》为题向全美民众发布。目前这份“倡议”公布的是框架性原则和发展目标,美国政府为人工智能发展增加新拨款和资源以及为此制定时间表和具体目标将在其后6个月内公布。

在这份倡议中,明确提出美国应该在5个重点领域发力:

  • 资金重新导向:联邦资金机构将提高AI领域的投资优先权。

  • 创造资源:联邦政府的数据数据、电脑模型与运算资源,都将开放给AI研究者。

  • 建立标准:美国国家标准暨技术研究院(NIST)会拟定产业标准,来促进开发更可靠、安全、可转移与具协同性的AI系统。

  • 重新训练人才:要求机构得透过学徒制、奖励、技术学习等,优先训练现有员工,让他们能够面对AI时代带来的挑战。

  • 国际触角:在保留美国本体价值与利益之下,建立国际合作、发展AI。

关于《倡议》,业界有诸多的解读。有观点认为,《倡议》释放了AI发展的诸多关键信息,应引起产业界高度关注:其一,数据是AI战略中的灵魂性命题,高品质、强相关性的数据短缺是整个AI界公认的难题。数据的完整性、准确性、可追溯性、安全性等已经成为真正影响AI实现商业落地、变现的核心关键。其二, AI会在法律法规上成为一个热点议题,不断演变,朝着更符合整个AI技术发展的态势发展。

我们有理由相信,随着《倡议》被进一步落实并执行,整个大数据/AI领域则会从各路资本蜂拥而入的状态逐渐进入冷静期。但这并非坏事,随着行业不断规范化大数据/AI领域无疑将迎来高质量发展。正如微软全球执行副总裁、人工智能微软研究院负责人沈向洋此前在接受媒体采访时表示:“所有的技术要想深刻影响社会,一定会体现在法律、法规上。”

二、可解释AI将成为未来重点方向之一

事实上,就AI战略而言,美国发布的时间较晚,是世界上第19个正式宣布AI未来战略的国家。相较于其他国家战略将发展技术作为重中之重,《美国人工智能倡议》的视角则从“技术”向“社会”扩展。这其中,与美国科技公司在人工智能领域拥有顶尖的人才与技术,但随之爆发的各种问题不无关系。

回顾2018年在美国发生的人工智能大事件,其中一些事件凸显出当前AI技术中存在的重要问题:

  • 2018年2月,美国国会举行关于AI技术的听证会,发言人警告称,AI领域长期存在偏见,特别是对有色人种的偏见。

  • 工业界和学术界专家于2月的一份报告中强调了AI技术在数字、物理和政治领域可能被武器化,并存在被滥用的多种方式。

  • 研究人员Joy Buolamwini和Timnit Gebru发表论文,显示AI面部识别的准确性在白人和有色人种间存在巨大差异。

  • 4月,Facebook 被爆出20亿用户数据均可能存在泄露。

  • 5月,谷歌首次出现集体请辞,抗议军方合作项目,300多名学者发联名信,提升AI公平性的工具开始着手开发。而Facebook发布用于识别数据偏见的工具,并开始测试相关算法。

  • 7月,马斯克联名2000多AI专家誓言禁绝杀人机器人。

  • 9月,更多旨在提升AI公平性的工具面世,美国国会进一步关注AI公平性问题。Google和IBM陆续发布了用于识别数据偏见的工具。另外,有国会议员致函FBI和平等就业机会委员会等联邦机构,询问它们是否制定了旨在缓解AI技术偏见的工具或政策。

  • 11月,微软发布微软人脸识别研究工作需要遵循的公平性、透明性、问责制度、非歧视性、知情同意、合法监视等六项原则。

  • 12月,谷歌全球事务高级副总裁肯特·沃克称,在能够制定出相关政策以阻止刷脸AI技术被滥用前,谷歌将暂不会出售该技术和产品。

由此可见,随着一系列事件的曝光,美国越来越重视AI技术标准的制定。事实上,各国的立法机构、监管机构以及专门进行人工智能安全(safety)研究的学术机构和企业界都已经开始尝试解决这些问题,并以实现的指南(guidelines)形式发布。IEEE的Ethically Aligned Design(伦理一致性设计)就是这样的一个黄金标准,它使用开源技术融合了一些关键的伦理指南。标准本身深入分析了创建从儿童和学生数据管理到算法歧视的13个不同的标准集的过程。

其他国家和组织也在跟进。欧盟最近就成立了一个伦理指南工作组(ethical guidelines working group),其中一项职责就包含具有里程碑意义的2017年阿西洛马会议(Asilomar Conference)的成果阿西洛马人工智能原则(Future of Life's AI principles)。

至于中国,在今年3月4日全国人大的开幕发言中,全国人大发言人张业遂表示,人工智能相关的立法项目已列入立法规划。多位互联网大佬,如马化腾、李彦宏的两会提案中都涉及到了关于建立数据收集、利用与保护的基本规则秩序,防范并打击数据滥用行为等内容。

由此可见,关于需要建立人工智能行业规范已成为很多国家的共识,且已成为刻不容缓的事。

三、“落地力”和“数据”才是未来竞争焦点

可想而知的是,随着人工智能行业规范的逐步建立,类似于炒作、挂羊头卖狗肉的人工智能产业将被得到清洗,此前一直被专家、企业大佬呼吁“警惕人工智能泡沫”的投融资过热的行业将进入冷静期。同时,随着世界各国高度重视AI、致力于将AI像“水电煤气”一样渗透到所有领域,引领社会变革,国家之间对于AI竞争的焦点,将集中在“落地力”和“数据力”上。

目前,虽然AI的“技术力”目前是业界关注的焦点,算法人才稀缺还是挑战,但随着人才培养加速,AI技术能力以云、以服务的方式提供,技术门槛不断降低,几年之后,那些看似问题的问题,都将不存在。到那时,落地才和数据力才是关键所在。

我们在考虑AI商业化、产生价值,运营一个可持续发展的AI时,需要注意的是要将4个环节逻辑性地串联起来。

  • 第一个环节是业务场景的梳理,即找到能够运用AI的行业痛点场景;

  • 第二个环节是数据资产的获取。目前世界上所获取的有价值数据可能尚不到10%,需要找到、获取与业务场景有强相关性的数据,这才是有价值的数据;

  • 第三个环节是处理和分析数据,需要运用大数据能力和人工智能的能力,构建数据模型、算法,为业务场景运营改良提供技术支撑;

  • 第四个环节是将数据分析人工智能分析所产生的洞察力,反哺到相关的商业应用,转化成为业务的价值,反哺于用户。

值得注意的一点是,除了数据力值得重视,要实现AI落地、AI产生价值,还需要复合型人才。在美国这份《倡议》中关于人工智能的“人才”培训有大量笔墨。《倡议》中对于人才竞争力的构建是非常重要的部分,而且不仅仅是强调对AI技术专才的培养,同时强调对具有AI产业化能力的运营人才和运用AI的人才培养。

事实上,目前美国已经开始着手从正规的教育体系中培养既拥有行业知识,又具有AI技术能力的人才。在美国得克萨斯大学、哥伦比亚大学,已经有专门为生物医药产业所配备的生物统计学人才培训,招募从事健康医疗的医药领域人员进入大学学习人工智能相关专业知识,变成这个领域的复合型人才,而这些人在市场上非常奇货可居。正是这些人将是AI落地产业、将AI产业化的关键。

以上是对《倡议》从数据、人才的重要性方向的解读。实际上,《倡议》并非单纯的技术路线图,而是从国家战略层面调动更多联邦资金和资源用于人工智能研发,是 “确保美国在人工智能领域的领导力”,应对来自“战略竞争者和外国对手”的挑战。

今天,有很多人认为人工智能是一场新的军备竞赛,各国都在激烈竞争,我们有理由相信,在2019年,人工智能将在全球舞台上发挥更大作用,影响投资该技术的超级大国之间的关系。人工智能的早期采用者(如美国和中国)将努力平衡自身利益与协作研发。拥有人才和数据力的国家将在预测分析等领域实现巨大增长,从而造成更大的技术差距。此外,各国将围绕人工智能的道德使用展开更多的对话,由于不同的国家对这一问题的处理方式会有所不同,这或将影响国际关系。总体而言,人工智能相对于其他国际问题的影响较小,但比以前更明显。

THU数据派
THU数据派

THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。

产业美国可解释性
2
相关数据
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

相关技术
沈向洋人物

微软全球执行副总裁,美国工程院院士。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

数据管理技术

数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,其目的在于充分有效地发挥数据的作用。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

大数据技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

规范化技术

规范化:将属性数据按比例缩放,使之落入一个小的特定区间,如-1.0 到1.0 或0.0 到1.0。 通过将属性数据按比例缩放,使之落入一个小的特定区间,如0.0到1.0,对属性规范化。对于距离度量分类算法,如涉及神经网络或诸如最临近分类和聚类的分类算法,规范化特别有用。如果使用神经网络后向传播算法进行分类挖掘,对于训练样本属性输入值规范化将有助于加快学习阶段的速度。对于基于距离的方法,规范化可以帮助防止具有较大初始值域的属性与具有较小初始值域的属相相比,权重过大。有许多数据规范化的方法,包括最小-最大规范化、z-score规范化和按小数定标规范化。

推荐文章
暂无评论
暂无评论~