人工智能,未来之路:微软 21CCC 大会概览

10 月 19 日,由微软亚洲研究院(MSRA)与哈尔滨工业大学联合主办的第十九届「二十一世纪的计算」 (21 CCC)大型国际学术研讨会在哈尔滨举行,多位计算机科学领域专家与现场超过 1500 名高校师生分享了计算机科学领域,尤其是人工智能相关的最新学术研究与应用成果。



黑龙江省副省长孙东生为大会致开幕词,他表示,人工智能、大数据等相关技术领域的创新,已成为引领传统产业转型升级和创新创业的重要力量。黑龙江省将持续深化政、企、校三方联动,构建产、学、研相结合的科技创新体系,培育东北老工业基地振兴新动能,相信哈工大、微软在人工智能领域的学术积累优势,对加快推进黑龙江省人工智能的科研和产业化工作具有重要的意义。



哈尔滨工业大学校长、中国工程院院士周玉表示,AI 正在改变人们的工作与生活方式,哈工大与微软亚研院在科研合作、学术交流和协同育人等多方面也都取得了广泛且深入的实质性成果,有效地促进了我国,特别是东北地区,计算机基础科研的创新与变革。



图灵奖获得者、IEEE fellow、ACM fellow John Hopcroft,ACM fellow、微软资深副总裁 Peter Lee 等多位计算机领域专家学者带来了共计六场主题演讲,以下为演讲实录。


Peter Lee:匠人 AI (Artisanal AI)


ACM fellow、微软全球资深副总裁 Peter Lee 认为,尽管人工智能已经渗透到几乎所有的微软产品与服务中,并且获得了巨大的价值,创造和部署这样的系统却仍然需要大量具有丰富专业知识的技术人才,这使得现在的 AI 就像「手工艺术品」一样,因其稀缺和昂贵,变成了少数人能够享有的服务。而如同活字印刷技术的发展会使得书籍走入寻常百姓家一样,技术的发展也会将 AI 也由手工阶段带入量产阶段。他认为,使这一目标变得可能的将是「服务、架构与工具」。微软正在通过诸如帮助开发者搭建聊天机器人的 Bot Framework、高效组织大规模数据的 Cosmos DB 和 CNTK 等工具实现这一目标。



John Hopcroft:AI 革命(The AI Revolution)


1986 年图灵奖获得者,康奈尔大学 John Hopcroft 教授带来了以《AI 革命》为题的主题演讲。他介绍到,深度学习是支持向量机(SVM)之后机器学习领域的重大发展。他以适用于图像识别的卷积神经网络介绍了深度学习模型的构成,并指出了在高维空间里找到更优的局部极小值点和神经网络模型的训练加速问题等前沿研究方向。


他同时指出,现在的人工智能,归根结底只是高维空间中的模式捕捉与识别,并没有理解物体的本质与用途。我们可能要等到下一次人工智能革命来实现这一点,而这个过程可能需要另外 40 年。但是,并不是所有与所谓的「智能」有关的任务都需要复杂的人工智能模型,例如国际象棋,只是需要庞大的计算能力和数据,因此当前的计算机已经能够做很多我们一度认为需要「智能」完成的事情了。


Lise Getoor:从图数据中获得有效的推理

AAAI fellow、加州大学圣克鲁兹分校计算机科学系教授 Lise Getoor 的研究对象为图数据(graph data),她介绍了一些图数据所需的常见推理模式,例如为缺失标签的节点做标签预测的协同分类(collective classification),给出数据里隐含的连接节点的边的连接预测(link predictions),以及判断两个节点是否为同一实体并进行合并的实体分辨(entity resolution),以及用于解决这些重要问题的一种技巧,概率软逻辑(probabilistic soft logic, PSL)。




Raymond Mooney:深度学习的进展、期许以及夸张营销

ACM fellow、AAAI fellow、德克萨斯大学奥斯汀分校计算机科学系教授兼人工智能实验室主任 Raymond Mooney 指出,近年来,深度学习诚然在图像识别、机器翻译、棋牌游戏等非常有挑战性的领域取得了长足的进展,但是其能力有被过分夸大的趋势。



在简要梳理了机器学习的发展史(从单层神经网络到知识工程、从多层神经网络和符号学习到贝叶斯学习和和方法、以及深度学习的复兴)之后,Raymond 列举了现今深度学习的三大推动力:算法、计算力和大数据,以及由此产生的几大制约因素,包括从无标签数据中学习,压缩模型的规模等。除此之外,深度学习系统还在面对针对性构建的恶意样本时仍然非常脆弱。



滕尚华:大数据与网络分析的可扩展算法

ACM fellow、南加州大学计算机科学与数学系教授滕尚华着重描述了「可扩展」(scalable)之于大数据时代算法的重要性。



数据体量的剧增使得人们对「高效」算法的定义发生转变,原有的多项式时间算法分析体系高效的算法可能不再适用于解决今天的问题,如今,我们要求算法是「可扩展的」,或者换言之,是有线性/次线性复杂度的。而设计具有可扩展性的算法,需要借助一些技巧,例如拉普拉斯范式。这类技巧包括局部网络探索、高阶抽样法、稀疏化以及图分割等。



大数据时代的算法分析——网络分析如今有如下几个应用领域:图模型的抽样、网络集中度估计、社交影响最大化以及随机行走的稀疏化等。


洪小文:学会学习,探索帮助机器与人学习的方法


微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士的演讲主要讨论了如何解决标注数据获取困难、指标相对主观等问题,以及随着人工智能对社会的影响越来越大,人们如何在机器的辅助下进行学习。



洪小文首先介绍了微软亚研院为了降低对大规模标注数据依赖性的学习范式——对偶学习指将互为对偶的两项人工智能任务组成一个闭环,让对偶任务的模型为原始任务的结果提供反馈。用例包括中英翻译与英中翻译、语音识别与语音合成、基于图像的文本描述与基于文本的图像生成等。此外,自增强学习方法利用未完成训练的卷积神经网络对无标签数据进行测试,生成增强数据进行训练。



此外,机器也可以通过提供建议和反馈、进行风格转换乃至艺术创作等方式帮助人类学习。



机器可以在多方面帮助人们学习,例如提供学习建议和案例,作为语言学习的辅助手段。他以旨在帮助初学者提高口语水平的「微软小英」为例,介绍了语音识别、语音合成、自然语言理解、机器翻译、机器学习、大数据分析等人工智能前沿技术如何能够辅助人类学习。AI还可以有艺术创造力:创作诗歌、歌词以及音乐,对图片进行风格转换等。在这方面,微软运用生成式对抗网络训练小冰创作诗歌,还利用「风格基元」(StyleBank)、端到端在线视频风格迁移模型等对图像、视频等素材进行艺术化创作。




最后洪小文博士总结到:人类和机器都从以「无所不知」为目标进入到以「无所不学」为目标,而在学习过程中,机器和人类将一同共进化。



产业
返回顶部