Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

演讲者:马维英

马维英:⼈工智能是字节跳动推进全球化的关键

2018 年 9 月 17 日,由国家工信部和上海市政府主办的 2018 人工智能大会「人工智能与实体经济深度融合发展论坛」在上海国际会议中心举行,上海市委常委、常务副市长周波,工业和信息化部科技司副司长王卫明,中国工程院院士邬贺铨等出席论坛。字节跳动副总裁、人工智能实验室负责人马维英发表题为《人工智能赋能全球创作与交流平台》的演讲。

马维英介绍称,字节跳动通过 6 年发展,当前产品和服务已经覆盖 150 多个国家、75 个语种,在 40 多个国家和地区位居应用商店总榜前列。技术出海,是字节跳动全球化发展的核心战略,人工智能技术是字节跳动全球化取得当前进展的关键。

基于人工智能技术,字节跳动重新定义了人和信息的连接方式,在行业内率先部署了大规模的人工智能模型。依托海量数据,由马维英领先的字节跳动人工智能实验室专注于人工智能领域的前沿技术研究,并将研究成果应用于公司全球产品中,利用人工智能帮助内容创作、分发、互动,提升用户的信息消费体验。同时,实验室也针对人工智能相关领域内长期性和开放性问题进行研究,帮助公司实现对未来发展的构想,促进人类信息与知识交流的效率与深度。

此次论坛还宣布字节跳动人工智能实验室项目《基于分布式机器学习平台的通用人工智能应用解决方案》入选 2018 国家工信部人工智能与实体经济深度融合创新项目。据了解,该创新项目将是建设「训练资源服务平台」的主力军。此次字节跳动的成功入选不仅体现了国家对字节跳动在人工智能领域技术优势的认可,也是对字节跳动在人工智能领域这个方向上不断探索创新的肯定。

以下为马维英演讲全文:

大家好!我是字节跳动人工智能实验室负责人马维英。今天非常高兴与大家相聚在上海,共同探讨人工智能的发展及应用现状,以及未来我们如何用 AI 赋能新时代。

首先我们来回顾一下,在整个人类历史洪流中,内容的创作,信息的传播和交流,一直是整个人类社会的基础设施。在大约公元 100 年前的时候,蔡伦发明了造纸术,人们开始用纸张来创作、传播。纸张和书籍成了人与信息连接的最主要媒介。从一开始,中国就扮演这样一个重要的角色,这些关键技术都是中国发明的。之后经过很长一段时间,直到三四十年前,信息的连接方式才有了新的变革。

互联网时代网站、网页让纸张消失,成为了我们的数字图书馆,我们开始使用搜索引擎,一键便可以直达自己的所需。

到了移动互联网时代,纸张消失得愈加明显,因为它让信息无所不在,人类可以随时随地用智能手机接触他所需要的信息。而且手机也变成一个人的网站,人可以用手机写文章、拍摄视频然后发布出来,并通过手机与其他人交流互动。原来在 PC 互联网时代有很多的机构媒体,到今天出现了无数自媒体,再到每个人都在创作,每个人都可以分享他的知识,他的生活的体验,他的故事。从 OGC、PGC 再到 UGC,在这个万物互联的时代,人与信息的连接可以做到无所不在。字节跳动这家公司就诞生于这样的时代。它颠覆了搜索引擎,建立了全新的人与信息的连接方式。

到最近,人工智能时代到来,也许未来我们还将共同迎接「超级智能时代」的机遇和挑战。今天有很多人问,那人工智能会不会取代人的创作呢?我个人相信人的想象,人的创作力,人的爱跟关怀是机器不可能取代的。所以我相信未来我们会进入一个人与机器互相帮助、互相学习的时代。人让机器更聪明,但机器同时也可以帮助人释放更多的想象力、创造力,各行各业都能够用 AI 来重新定义我们的产业。

字节跳动这家公司有几个比较重要的产品,第一个就是大家比较熟悉的今日头条。它也是在中间连接两端——一边是信息的源头,包含文字、图片、视频、直播、问答、AR、VR,它是全信息、全媒体、全内容的平台。另外一端是人,不单是个人,我们有兴趣小组,有社群。

PC 时代的搜索,没办法做到个性化、社交化、移动化、无所不在化。今天我们利用新的技术,重新颠覆。字节跳动一边让 AI 学习大量的形式多样化的理解内容,另一边我们为每个人建模——根据每一个人的兴趣爱好和他的使用行为。我们将搜索引擎里所有排序、分析等技术,都用于进一步的个性化精准推荐,从而变成信息流。信息流是一种新的、更智能的方式,让人能够随时随地获取他所要的信息。这时候手机就相当于一个助理,能够像助理一样理解他,为他提供他所需要的信息。

过去一两年,短视频成为一种在世界范围内最受欢迎的信息生产与消费形式。字节跳动旗下短视频产品的代表抖音也风靡全球。

今年一季度,抖音下载量超越 Facebook、Youtube、Instagram 等,成为全球下载量最高的 iPhone 应用;抖音的全球化布局始于 2017 年 8 月,截至目前,抖音海外版 TikTok 已覆盖全球 150 多个国家,抖音及海外版 TikTok 全球月活已经突破 5 亿。

随着 TikTok 在海外接连获得佳绩,抖音已经成为中国产品在海外获得成功的一个典型,被视作中国移动产品出海的新模式。作为一款中国产品,抖音在全世界范围成了受喜爱的内容传播平台,我想对于我们中国文化走出国门影响全世界,抖音应该可以发挥积极的助力作用。

但建立这样一个公开、开放的平台,任务是非常艰巨的。因为每一位用户都能够自己上传内容,于是我们需要做非常多的事情。我们必须为这些内容做审核、分类、查看是否侵犯版权、做推荐,还要做相似性的搜索,语义的搜索。而这些都离不开人工智能的帮助。

台下如果有熟悉抖音的来宾,应该会对抖音的各种特效、滤镜、创意玩法印象深刻。可以说这些正是这款产品制胜的关键原因之一。而它们都是 AI 技术在短视频中的应用。

我们通过人脸和其他人体关键点检测与追踪,可以实现玩变脸等创意效果,尬舞机、控雨、控花瓣等等都是抖音非常受欢迎的玩法。我们的视频切割技术还能实现染发、背景替换等各种效果。

除了应用于短视频产品,字节跳动的人工智能技术还通过我们的多款产品赋能信息创作与交流的各个环节。

我们通过自然语言理解和自然语言生成,自研了一个写稿机器人。xiaomingbot 写作机器人获得了吴文俊人工智能科学技术奖。小明能够自动写作,特别是一些垂直领域,像体育、房产、汽车、天气等相关的新闻,小明可以每天产生新闻播报。

相比于人类作者,小明的效率和产量高。一个体育比赛结束之后两秒钟,我们的自动转播,自动写作的报导就上线了。过去一段时间小明已经有了几万粉丝,他写的东西获得了几十亿次阅读。小明写作还支持很多的语言,除了中文之外,有英文,和其他的语言。那下一个就让大家看一下小明的工作基本原理。他其实分析了多种数据源头包含的文本、图片、视频。

大家现在看的是 2018 年世界杯中比利时对日本的那场比赛。可以看到,小明能实时对这个视频做理解,通过视觉识别球员和他背后的编码,自动生成描述文本。例如「某某球员在某个时间进球」。

自动写作体育新闻可以实现体育转播千人千面。每个人你可以看你喜欢的球员,而不是说每个人获取的报导都一样。你可以专注你想专注的球队或球员,而且我可以把这个球员立体的信息,他的胜负率,他本赛季表现如何,容纳到你看到的报导里面。

我们全球的用户每天创造出海量内容,这意味着什么呢,意味着同时我们的审核任务和压力是巨大的。为此我们建立了 600 多个审核模型,拥有近亿条数据的庞大数据库。人工智能辅助审核需不仅要对文字、图片做识别,还要识别语音、视频。有时候视频看的没有问题,但语音有问题,语音我们也需要转成文字,进一步再识别。这些图像、文字、视频识别模型经过训练,可以大大提高审核的自动化程度。

人工智能加上我们的审核人员就形成闭环,AI 是我们为审核人员训练出来的工具。同时,审核团队在工作中提供了很多标注,监督式机器学习可以使用这个大数据来训练自动视频理解系统。而训练后的系统再给审核人员用,那他们就能更高效地审核,并且能提供更多的反馈和新的标注数据。所以人和机器是共同学习的,机器帮人,人又帮机器,形成正向循环,不断地迭代大数据

目前我们的人工智能大概为公司节省了十万级别的人力。如果没有人工智能辅助审核,那我们的审核团队人数就将是现在的很多倍。我们也有计划把这些数据能够标准化和公开,也可以搞竞赛,让学术界更多的研究人员能够利用这些数据来做研究。

这就是我们一直在努力做的事——建设新一代人工智能驱动的信息平台,连接人和信息,从内容创作、过滤、审核、分发、搜索、消费以及互动的每个环节,促进创作和交流。

从图上我们可以看到,从信息的创作端的创作者,到信息消费端的读者,每一个中间人与信息连接的都是一个信息流。字节跳动建设这个这个人工智能的基础设施+服务平台,可以支撑整个公司数据的处理、分析、挖掘、理解、组织。同时又能让人工智能进一步学习这里面每一个环节的语义表达方式。

未来整个社会要从数字化进一步走到智能化表达。今天人工智能可以用来学习从数字表达到语义表达的转换,因为数字化之后还不够,计算机无法直接理解,人工智能学习语义表达全世界,在那个空间里计算机的能力就可以发挥。用向量计算加加减减就知道图像里面是什么,加加减减就知道它的内容能产生什么样的情感,是悲伤、是快乐,是害怕,对内容有产生情感的认知。

我们也希望这样一个新一代的人工智能驱动的信息平台建设完成之后我们能够进一步去赋能,能够对外去输出这些能力,能够帮助其他的企业,能够利用 AI 去赋能更多行业和应用场景,可以是医疗、教育、财经、媒体,或者说一些新的内容,例如垂直的应用。

为了实现我们的这些构想,用人工智能赋能新时代,我们字节跳动人工智能实验室一直在不断钻研探索。我们目前主要的研究领域包括机器学习、自然语言理解、计算机视觉人机交互与机器人等方向,我们实验室有一群国内外一流高校毕业的科学家以及拥有多年一线机器学习应用开发经验的工程师团队,一起专注人工智能领域的前沿技术研究,一同攻关克难。

和历次工业革命一样,我们如今迈入人工智能时代,是人类社会了不起的进步。而技术的进步最终是服务于人类的。我们钻研技术不仅是钻研技术本身,更重要的是研究如何用它来解决人类社会的难题。 

几年前,我们就开始将人工智能结合产品功能积极服务于公益。比如借由我们的精准推送,根据他的走失时间、地点,把走失者的信息推送给这些可能有信息线索的人。目前整个头条寻人,已经找到了超过 7000 人,应该是中国寻人机构找回走失者最多的,平均每天至少找到 10 位,最多的时候一天找回 29 位。我们还帮助很多台湾老兵找到了大陆的亲人,帮助 51 个家庭跨越海峡两岸团聚。

我们还利用技术去实现精准扶贫,让四川省古蔺县、甘肃省夏河县、贵州省雷山县的山货走上头条,盘活优质文化物质资源,服务国家乡村振兴战略。

在教育方面,我们也认为 AI 有机会帮助教育。因为我们可以用人工智能技术来连接有教育资源的人跟需要教育资源的人。我们可以用 AI 技术把最好的师资、最好的教材传递到偏远地区。像我们的「益童乐园」贵州起航,「乡村 AI 教师」也全面建成,我们希望让贫困地区的孩子也接受到良好的教育。

基于我们前面提到的种种尝试与努力,字节跳动的愿景也正在逐步实现——建设全球创作与交流平台。公司成立至今六年以来,我们的产品和服务已经覆盖 150 多个国家、75 个语种,在 40 多个国家和地区位居应用商店总榜前列。而这背后,正是科技和创新在推动我们全球化的发展。技术出海,是字节跳动全球化发展的核心战略,人工智能技术是字节跳动全球化取得当前进展的关键。作为人工智能时代的中国创业者,未来字节跳动将继续孜孜以求,帮助全世界的用户更好地创作、交流、互动,也为中国人工智能的发展贡献一份力量!

谢谢大家!

产业字节跳动马维英
1
相关数据
字节跳动机构

北京字节跳动科技有限公司成立于2012年,是最早将人工智能应用于移动互联网场景的科技企业之一,是中国北京的一家信息科技公司,地址位于北京市海淀区知春路甲48号。其独立研发的“今日头条”客户端,通过海量信息采集、深度数据挖掘和用户行为分析,为用户智能推荐个性化信息,从而开创了一种全新的新闻阅读模式

https://bytedance.com
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

自然语言生成技术

自然语言生成(NLG)是自然语言处理的一部分,从知识库或逻辑形式等等机器表述系统去生成自然语言。这种形式表述当作心理表述的模型时,心理语言学家会选用语言产出这个术语。自然语言生成系统可以说是一种将资料转换成自然语言表述的翻译器。不过产生最终语言的方法不同于编译程式,因为自然语言多样的表达。NLG出现已久,但是商业NLG技术直到最近才变得普及。自然语言生成可以视为自然语言理解的反向: 自然语言理解系统须要厘清输入句的意涵,从而产生机器表述语言;自然语言生成系统须要决定如何把概念转化成语言。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

暂无评论
暂无评论~