GMIS 2017大会Yinyin Liu演讲:演变中的人工智能,与模型俱进

全球机器智能峰会( GMIS 2017 ),是全球人工智能产业信息服务平台机器之心举办的首届大会,邀请来自美国、欧洲、加拿大及国内的众多顶级专家参会演讲。本次大会共计 47 位嘉宾、5 个Session、32 场演讲、4 场圆桌论坛、1 场人机大战,兼顾学界与产业、科技巨头与创业公司,以专业化、全球化的视角为人工智能从业者和爱好者奉上一场机器智能盛宴。


5 月 27 日,机器之心主办的为期两天的全球机器智能峰会(GMIS 2017)在北京 898 创新空间顺利开幕。中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃为本次大会做了开幕式致辞,他表示:「我个人的看法是再过几年,我们90%的工作是人工智能提供的,就像我们今天大部分工作是机器提供的一样。我们的工作就是尽快让我们的鞋底也像人一样聪明,而不是鞋底比我们聪明,这就是人工智能给我们提供工作的机会。我们知道人工智能会给我们提供一个更美好的未来。」大会第一天重要嘉宾「LSTM 之父」Jürgen Schmidhuber、Citadel 首席人工智能官邓力、腾讯 AI Lab 副主任俞栋、英特尔 AIPG 数据科学部主任 Yinyin Liu、GE Transportation Digital Solutions CTO Wesly Mukai 等知名人工智能专家参与峰会,并在主题演讲、圆桌论坛等互动形式下,从科学家、企业家、技术专家的视角,解读人工智能的未来发展。


1.jpg


上午,英特尔人工智能产品事业部数据科学主任 Yinyin Liu 发表了主题为《演变中的人工智能:与模型俱进》的演讲,她探讨分享了如何用同一种模型为不同行业提供解决方案,以及如何让各个行业的专家建议推动整个人工智能生态系统的发展。以下是该演讲的主要内容:


大家好,我是来自英特尔 Nervana 人工智能事业部的 Yinyin Liu,现担任数据科学主任一职。我非常容幸能来到这里,看到AI研究人员和相关领域专家在这里齐聚一堂。对于你们当中的一些人来说,当务之急是寻找有哪些 AI 解决方案能够解决你们专业领域的问题。而另一些人可能好奇这些AI 模型如何推动整个生态系统的发展,并对模型在其他行业应用的效果持怀疑态度。


在英特尔 Nervana,我们的数据科学家会直接跟行业专家打交道,我们尝试理解他们的真实应用场景,并试图在 AI 算法和他们的问题之间建立联系。这样的一种迭代的方式,使我们能够给出有效的方案。今天我想跟大家分享一下我们在这方面的一些实践经验。


AI 模型是一些将理论与实践相结合取得的突破,AI 模型也在广泛的领域内产生着影响。比如一个 AI 从业者的设计过程包括:满足数据集需求、设计工作流程与训练过程、设计在当下 AI 框架下的优化模式、并使用正确的计算设施。然后我们把相关领域专家引入这个过程中。所有这些要素组合在一起,决定了解决当前问题的重点难点是什么,什么样的解决方案是行之有效的。


blob.png

接下来我想跟大家来分享一下一些将 AI 模型用于不同行业的案例。


近期,深度学习是推动AI的发展的主要动力,这里是一个大家都非常熟悉的模型(卷积神经网络)。这样一个端到端的模型以图片的原始像素数据为输入,直接试图学习如何预测图片的标签。在这个例子里,标签是图片里的人的名字。这样的模型识别常见图像的效果非常好,然而除了识别日常场景之外,它还能解决什么其他领域的问题呢?


我们在精确农业领域做了些尝试,AI 解决方案为行业带来了革命性的改变。我们将行业中的难点缩减为几个问题,其中一个是作物疾病检测。这里有两张作物图片,它们感染了不同的疾病。我们如何能将刚才展示的人脸识别模型转化为一个疾病识别模型呢?我们用作物图片替代人脸图片,并用疾病名称标签替代人名标签。然而在此类实际应用中的一个挑战是有限的数据集。不像 ImageNet 数据集,我们的专业领域数据集并没有上百万张图片可供训练。因此我们使用了一种非常重要的深度学习的方法,迁移学习。我们用 ImageNet 数据库训练模型,训练结束后,中间这些神经层能够很好地抓取图片中重要的特征,然后我们将部分网络复制到一个新神经网络中,在顶层添加一些神经层,并针对特定领域的问题进行重训练。在此过程中,原先已经训练好的部分会得到微调。我们发现这是一个非常有用的工作流程,这样的一种方法可以应用到很多不同的领域和数据库当中。因此在我们的平台上,我们支持这种工作方式让大家可以方便地应用迁移学习。


大家可能很好奇,这个模型经过了训练去做特定工作,他们如何进行决策以确保将这个工作做好呢?我们在平台中引入了一些数据可视化工具,给定数据和模型,我们试图将卷基层反转,建立一个逆卷积过程,简言之,我们希望建立一个「编码-解码」过程。用这个数据可视化模型,我们得到了中间这幅图像,并且非常激动地发现,模型能够正确抓取解决问题所需的信息。


blob.png


在精确农业领域的另一个问题是作物产量预测。同样的,应用迁移学习,我们把这个图像识别模型转化为图象分割模型。我刚才给大家展示的的「编码器-解码器」结构,不仅适用于数据分析,也适用于图像分割问题。当(携带摄像头的)拖拉机走完整块土地,你就能精确地知道这块地的作物生长情况。


将图像模型用于自动驾驶领域中,是一个更难的问题。人类驾驶员看到的是上面的图片,计算机需要的是下面的信息。


blob.png


当我们将图象分割技术用于自动驾驶,我们需要将不止一种信息从背景中剥离出来。我们需要分割所有对驾驶有用的信息。这对于训练数据的类型产生了新需求。我们需要将每一个像素都分到一个类别中,而这种数据是很难获得的。 所以我们会制订一些新的工具,让人可以模拟这样的环境来创造出所需的训练数据。在 Intel Labs 我们也做了一些其他研究,有一项研究解除创造数据的过程对人工标注的依赖。比如在游戏引擎中,你知道如何搭建一个虚拟世界,因此用它的结构,我们能生成需要分割的不同图层。经过验证,用这样方法生成的图像非常适合用于自动驾驶模型的训练。
自动驾驶是非常具有挑战性的问题,它需要适应不同的环境、应用于不同的情形,所以通常我们需要不断训练、优化和改善我们的模型。所以我们需要AI平台能进行持续的训练、数据收集,并且持续把最新的模型投入应用。我们正努力在我们的平台上来建立这样的闭环支持。


如刚刚所示,一个模型或一系列类似的模型可以应用于解决不同领域的不同问题。除了自动驾驶和精确农业,我们的团队还和能源行业的专家合作,将图像分割用于断崖检测,并在医疗影像领域将模型用于检测肿瘤。


当我们处理序列的、时序的或触觉信息时,循环神经网络非常适于学习数据的先后关系。最新的循环神经网络中还引入了 Schmidhuber 博士发明的 LSTM 结构。这种结构也能被用作构建「编码器-解码器」结构。这种序列到序列的映射方式被广泛用于语音识别,事实上它可以接受非常多种不同的输入输出。在翻译问题中,它把一个英语句子映射到一个法语句子。在问答问题中,它把一个问题映射到一个回答。在思考模型的应用场景时,来自金融行业的用户向我们提出了这样的一个问题。每天,金融行业从业者需要从海量数据中提炼出有用信息。通常情况下信息都太多了,没人能够通读所有。因此我们就在思考能否进行语句主题分析或段落主题分析,让用户只需要关注和他的领域相关的信息。我们采用一种名为 skip-thought 的模型,它非常适用于表示句子。和单通道的「编码器-解码器」拓扑结构很类似,模型中一个编码骑可以与两个解码器相连。我们只需要将连续的、非结构化的文本数据一句接一句地输入模型,模型会根据语义结构为特定领域的语句创建最佳的表示方式。


基于句子的向量表示,我们可以继续将句子映射到不同的话题中。这给了我们全新的利用文本信息的方式,能够更好地将文本信息用于信息收集。


blob.png


在图中,每一个点代表了一句话,而每一种颜色代表了一个话题。作为用户,你不再需要逐份pdf 浏览,你可以利用这个可视化工具并只关注与你相关的类别。


类似地,同一个序列模型可以被应用到不同的领域当中。


我刚才向大家展示了序列模型在自然语言领域被用于语句分析。我们也用循环神经网络与语音识别技术为汽车搭建了语音系统、为金融行业做时序分析,乃至进行基因组分析。
所有的这些模型都,都助力于推动整个AI生态的发展。


blob.png


我们将这些技术和模型放到这些领域当中来解决我们面临的实际问题,AI 在各领域的逐步渗透,最终反过来对 AI 领域本身产生了巨大影响,并让其他的行业能够向我们一样理解、学习与应用 AI。
目前,大多数 AI的进展是由深度学习推动的,AI 专注于从大数据中提取信息、做出决策、预测未来并给出特定环境下的优化方案。


在我们的经验里,我们以模型为起点,逐步上升到对特定数据服务以及特点工作流程的高层需求。我们将这些经验融入英特尔 AI 平台的设计中,也将模型对更底层的计算的需求融入最新的硬件设计中。


在英特尔 Nervana,我们试图提供一个端到端的 AI 平台,提供各种类型的芯片、开源库、工具包,以及不同领域的解决方案。我们也在此展示包括 Crest 系列在内的各式英特尔产品。


我希望我的演讲清楚地阐释了我们在 AI 应用方面的实践,我们把不同领域的问题以及不同行业的专家引入到过程中,将他们的意见和想法融入平台设计。我们也从中明确哪些问题亟待解决、哪些解决方案对其他人最有用,以及,我们共同期待建立一个什么样的未来。我们加入了 Partnership on AI,希望与 AI 社区以及其他合作伙伴一道,构建能够更好地服务于社会的 AI 产品。

产业
返回顶部