GMIS 2017大会马维英演讲:信息流的未来与人工智能的机会

全球机器智能峰会(GMIS 2017),是全球人工智能产业信息服务平台机器之心举办的首届大会,邀请了来自美国、欧洲、加拿大及国内的众多顶级专家参会演讲。本次大会共计 47 位嘉宾、5 个 Session、32 场演讲、4 场圆桌论坛、1 场人机大战,兼顾学界与产业、科技巨头与创业公司,以专业化、全球化的视角为人工智能从业者和爱好者奉上一场机器智能盛宴。


WX20170527-122851.png


5 月 27 日,机器之心主办的为期两天的全球机器智能峰会(GMIS 2017)在北京 898 创新空间顺利开幕。中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃为本次大会做了开幕式致辞,他表示:「再过几年,90% 的工作将是机器提供的。希望人工智能可以为我们提供更美好的未来」。大会第一天重要嘉宾「LSTM 之父」Jürgen Schmidhuber、Citadel 首席人工智能官邓力、腾讯AI Lab 副主任俞栋、英特尔AIPG数据科学部主任、GE Transportation Digital Solutions CTO Wesly Mukai 等知名人工智能专家参与峰会,并在主题演讲、圆桌论坛等互动形式下,从科学家、企业家、技术专家的视角,解读人工智能的未来发展。


2.jpg


上午,今日头条副总裁、人工智能实验室负责人马维英发表了主题为《信息流的未来与人工智能的机会》的演讲,他探讨分享了今日头条在人工智能时代,信息流的机遇和挑战,详解了今日头条如何利用人工智能促进人类社会信息交流与写作。以下是该演讲的主要内容:


我是马维英,今年2月加入今日头条。在过去3个多月的时间,我特别看到信息流时代的来临,人工智能今天可以重新定义一个新时代的信息平台。今天我想借用这个时间跟大家介绍我们所看到的这个领域的最新的发展。


首先我们来看一下今天很多人谈人工智能、第四次工业革命。人工智能的本质是什么呢?今天我们到底人类社会整个科技界得到了什么样新的能力呢?


其实今天人工智能的本质是一个软件产业的革命。我们都知道,软件产业正在吞噬全世界,然而软件产业本身在被颠覆。在过去二三十年的数字化过程,万物已经被数字化,一切事物一旦被数字表达之后,计算机就可以用它庞大的计算能力推进,用光速推荐在人类社会类比世界里面一个旷日费时的过程,今天进入万物互联,不断的给我们去控制每个终端的机会,今天我们已经有一个数字表达的世界了。


3.jpg


第二个能力云计算,还有越来越多的,今天我们看到的越来越多的GPU、TPU还有一些新的PGA处理越来越大的矩阵的计算,我们也看到终端,像手机也越来越普及,今天我们能够在云端训练一个非常大的机器学习的模型,也可以在终端训练一个模型。今天有这两个能力,软件本身已经成为非常非常大的模型,这个模型里面有一些参数,当这些参数已经用软件工程师借着编程语言把这样一个东西写出来,在过去的二三十年,我们有大数据,借着机器来学这些参数,所以我们看见软件越来越智能。


有很多公司看到了「AI+」或者「+AI」能够颠覆原来的很多原有产业。在马维英看来,今日头条重新定义信息平台。以前搜索引擎对用户的理解可能只是几个密切搜索的关键词还有点击过的网页,它与网站有没有直接关系,并且要做反向工程(reverse engineering),把网站里的结构信息重建后做相关排序,而每个人看到的搜索结果都是一样的,排序算法没有针对个人个性化。


今天,在头条上对每个用户建立了一个很高维的向量表,每篇文章不论是新闻、图片、视频、直播、问题或答案,都是一个高维向量的深度学习学出来的表。在中国今日头条有海量用户,机器知道他们在什么时候想看什么,这些信息帮助我们理解了用户。


马维英表示,像今日头条这样的产品,一端可以看到越来越多的各式各样的内容,不光是新闻,看到越来越多的像短视频、直播、问答都已经成为新内容;在另一端连接人与信息,人也进一步组织更多的内容,借由类似微头条这样的产品,引入更多的社交功能。「我们的目标就是成为一个最懂你的信息平台。」马维英说。


此外,马维英还强调,今日头条目前在中国有1亿的日活跃用户,平均每天用户使用时间为76分钟。用户有这么长的时间使用头条的产品,因此头条有更多机会了解用户,对用户的未来需求做出预测,作出更好的内容推荐。


讲到未来的信息流,马维英认为,在PC互联网时代,信息的创作端跟最终的信息消费端关系并不紧密,而今天对于今日头条而言,在用户端已经看到了各式各样的信息流,还有其他各式各样的应用,可以看到都是新的信息流流出的管道,大家看到的是整个信息流里面的每个环节。


马维英表示,「头条要做的就是的AI Infrastructure,来提供所有AI的解决方案,在中间每个环节提供处理、分析、挖掘、理解,组织这里面所有的内容,从内容的创作到内容的审核、过滤。当然我们现在有人工标注、人工运营,但是我们也一步一步的把更多的人工智能的自动理解内容做进来,一旦过滤审核过了之后,我们就进一步的根据用户来分发,分发之后用户跟信息进一步的交流、互动,最后连信息的消费者今天也越来越多成为信息的创作者。」


人工智能清楚的定义每一个输入跟输出,每个信息流中间都可以做迁移学习,一个用户的兴趣爱好可能也能够帮助学习另外一个用户的兴趣爱好。我们有大数据、大用户,非常长的用户时间,而且有这么多丰富的应用场景,几乎在所有信息平台、消费,从创作、分发、消费、互动每个环节都可以进来,大大的改善。头条接下来要做的,是从现在今天这样一个已经数字化的时代,能够转换到一个语义表达的时代。头条开发了很多人工智能的标注工具,帮助他们标注的更好,他们标注的结果可以得到一些另外的反馈,又重新来帮助我们的机器学习,机器学习又学出更好的算法,又提供更好的工具给审核标注人员,审核标注人员又更高效的标注了很多新的样本,产生正循环。


马维英谈到了今日头条的闭环,「闭环的概念包含了我们的工作人员、运营人员、审核人员,我们的工程师,我们做人工智能算法的研究人员,还有我们最终用户在使用我们头条产品的时候每一个点击行为。这是比PC互联网时代更好的机会,今天我们可以更紧密的跟创作端合作。」


4.jpg


如今,在今日头条可以看到新的运用人工智能连接人与信息的机会。在过去的人类历史洪流中,从结绳记事传递人与自然的关系,一直到公元前2000年纸的发明,1000年左右活字印刷术的发明,其实纸张和书成为一个人与信息连接的主要媒介,但是经过很长很长的一段时间,几乎是到了过去三四十年才走到了一个新的时期。互联网时代网站让纸张消失,但是在移动互联网时代,纸张的消失更明显,因为它让人可以无所不在,可以用智能手机接触他所需要的信息。


最后马维英说到,「今天我们进到一个人工智能的时代,我们认为我们可以利用这样一个新的技术,来让每一个人都能够有一个无所不在的机器智能,帮助他们能够来发现、使用、交流跟创作信息。」

产业人工智能今日头条马维英产业信息提取机器之心
暂无评论
暂无评论~