2 亿条视频、76 种语言、观看时间提升 20 倍…… Google Brain 如何让 YouTube 焕发生机

编译 | 微胖

来源 | The Verge

作者 | Casey Newton

去年,我正在玩《羞辱 2》。和往常一样,上 YouTube 搜索某个游戏关卡的闯关秘诀视频。问题解决了。但是,当我第二次登陆网站时,被眼前的景象惊到了:网站为了提供了大量相关视频盛宴:玩家无需保护即可通关的视频、以相当具有创造力的方法击败敌人的视频...... 我只不过问了一个问题,但 YouTube 给了我一个世界。

接下来,我访问网站次数明显增多。大多数时候,并无特定目的——我已经习惯自发上那儿溜达。今年春天,我在家做饭的次数变多了。在我搜索过如何做份沙拉的视频后,YouTube 迅速为了介绍了一帮「主厨大师傅」。

2005 年,YouTube 诞生。这个网站一直很有用,也是互联网的重要支柱之一。但是,过去几年来,网站表现的出乎意料地赞。它可以相当准确地预测我感兴趣的视频,比以前强太多。

背后发生了什么?过去 12 年来,YouTube 已经从一个搜索驱动的网站变成一个「终点」。期间,经历了几百次测试、重新设计以及 AI 技术的飞跃。

不过,网站真正的「升级」在于:它变成了一个 Feed。(网络中的 feed,一种用来提供信息的方式。feed 其实是一种网络广播,只要你记录下这个广播电台的频率,也就是feed 地址,当你打开收音机,也就是feed 阅读器的时候,你就可以及时获取所有新的消息了。编译著)

或许你不记得 YouTube 最初的样子了。当时,它无非是一个基础架构:提供一种简单的方式,将视频嵌入其他用户最有可能看到这些视频的网站。随着网站逐渐变大,YouTube 变成了一个电视视频档案馆。YouTube,连同维基百科,可谓互联网世界里最可怕的兔子洞:如果同事偶尔在饮水机边提到了哈林摇(Harlem Shake),整个晚上你可能就耗在网站上追视频了。

当时,Facebook 推出了一种典型服务模式:News Feed,根据你的个人兴趣,不断更新定制化服务。Feed 接管了整个互联网。YouTube 的早期定制化服务十分有限:请用户订阅频道。这个比喻借鉴了电视。ComScore 数据显示,2011 年,订阅服务取得了一些成功,不过每个人花在 YouTube 上平均时间很一般。

如今,频道不复过去的风光。打开手机应用,它隐藏在了一个独立的标签里。涌现在用户面前的是一系列根据你的喜好定制的推送内容。这些内容都来自你订阅的频道,但是也有你之前从未见过频道里的相关内容。YouTube 的武器不仅可以推送内容,而且准确率还特别高,效果就是用户观看时间的延长。

「当用户知道自己要找什么时,他们会来我们这里。」YouTube 推荐技术总监 Jim McFadden 说。他是 2011 年加入公司。「我们也希望满足一些可能用户自己都未必清楚的需求。」

2015 年,YouTube 开始使用 Google Brain 的技术。不过,这并非网站首次尝试 AI。之前,YouTube 就将机器学习用于内容推荐方面,当时用的谷歌打造的系统——Sibyl。Brain 的不同之处在于采用了无监督学习。这种算法可以找到工程师可能都无法猜到的关系。

「重要的功能之一是泛化(generalize)」,McFadden 说。「如果我看来一部喜剧演员的视频,之前的推荐系统很善于推荐另一部这样的视频。Brain 不同之处在于,他可以计算出其他类似但并不雷同的喜剧演员的视频,毗邻的视频内容。它可以发现不那么显而易见的关系。」

Brain 算法开始针对手机用户推出更短的视频内容,但是会为电视用户推荐更长的视频。平台不同,推荐视频类型也不同,用户观看时长也更长些。2016 年,YouTube 大概进行了 190 多个类似变更,今年就增至 300 多个。网站发现组的团体产品经理 Todd Beaupre 说,「积少成多。一般尝试 10 次后才能发布一个。」

另外,Brain 的算法也比之前使用的算法更快些。过去,用户的行为几天后才会被纳入未来推荐中。这样,就很难识别一些流行主题。延迟的单位不应该是天数,而是小时或者分钟数。Beaupre 说。

Brain 带来巨大变化。70% 的用户在线观看视频时间都由算法推荐驱动。每天,网站会给用户推荐 2 亿条、76 种语言视频内容。在线观看时间比三年前提升了 20 倍。

这和我的体验大致吻合。几年前,我只是在午饭期间去 YouTube 逛一下,为了吃饭时有事可干。但是,推荐的东西更懂我之后,一周当中我会更规律地腾出时间浏览网站,而且是在我的 PlayStation 4 上,这样可以在最大的屏幕上看这些视频。

这确实是真正的个性化推荐。而且,在给我的数字化生活充电方面,这个网站也不同于其他网站。比如,Facebook 的 Feed 主要基于好友的博文内容以及我喜欢的页面。在获知某人订婚、怀孕生子方面,这确实挺在行;推特的内容主要来自你收听的对象,以及这些人转推的内容。记者出身的我离不开推特。

每一种推送都有自己的闪光点,不过 2017 年,这些闪光点都被埋没了。推特上,政治讨论大行其道。Facebook 对诸如事件(event) 等功能的短暂狂热以一种不和谐的方式让 Feed 变味,我反而更少联系朋友了。(重图片的 Instagram 感觉仍然是绿洲,也难怪它的应用程序用户量仍在快速增长)。

所有这些网站都需要用户为它们做贡献。但是,YouTube 用户中只有少数曾经上传过视频。这个网站不给你压力去做些什么。你可以仅仅被动地享受,就像看电视一样。

YouTube 对相关内容的强调意味着,较之竞争对手,其 Feed 的内容范围越来越宽,也越来越让人好奇。你搜寻得越深,就越会感觉这是一块躲避其他网站推送内容的避难所。

2013 年,Alexis Madrigal 在《大西洋月刊》的一篇文章中写道,Feed 的巅峰时刻已经过去。未来属于有限体验:电子邮件新闻;Medium 集锦,10 剧集的 Neflix 系列。没完没了的内容流服务会让人感觉精疲力竭。未来需要的是「更快!更多!」他写到。

四年过去,YouTube 的经验告诉我们,Feed 会变得更加重要。不断增长的视频存货,更加精准的内容匹配技术,这些都是无法抗拒的事实。现在,网站还会调查用户对推荐视频的感受,随着时间的推移,推荐效果会越来越智能,进而增加内容的消费量。

Beaupre 将这一过程形容为跨过鸿沟。「一边是与用户喜欢内容紧密相关的内容,一边是有流行趋势的内容。两者之间是一块神奇地带。」如果对手找不到办法跨越两者之间的地带,那么,他们会很难战胜 YouTube。

文章来源:https://www.theverge.com/2017/8/30/16222850/youtube-google-brain-algorithm-video-recommendation-personalized-feed

入门谷歌大脑YouTube产业深度学习产品
1
暂无评论
暂无评论~