Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

是AI选了吴亦凡去当《中国有嘻哈》评委,我有什么办法


刘昊然演网剧、易烊千玺上综艺节目…竟然都有人工智能在背后「捣鬼」?

采访、撰文 | 太浪

编辑 | 宇多田

「我刚到横店,我感觉到找到登天的梯子了。从拍群众、特约一步步慢慢上,最后经过奋斗努力,成为大明星。」

42岁的焦长道,是个有着11年横漂经历的老横漂。在央视纪录片《横漂》中,他给其他「横漂」讲述了自己的故事,「但是经过十一年的发现,感觉,要想被导演发现,有伯乐发现,太难了。」

为了得到导演的重视,他和其他「横漂」打算拍一部反映自己生活的短片《追梦人》,先建立群众基础。他们想,在观众中有了呼声,就能得到导演的重视。

横店之外,北京也是怀揣影视梦的外地人、寻求拍戏机会的热门去处,这些人被称为「北漂」。

为了得到一个角色,他们可能需要跑很多年龙套。

图说:为了追逐演员梦,小镇大龄女青年如梦(女主角)跑了十几年龙套、做了很多次替身,没有希望,但依旧在片场漂。

一方面,许多素人演员迫切需要角色;另一方面,很多角色也希望能寻找更合适的演员。

两方需求的不匹配,一直是演艺圈存在的问题。

而现在,随着「爱优腾」以及芒果TV等视频平台自制内容的增多,他们也有了更多角色需要适配合适的演员。

但传统的人工选角方式由于速度、地域以及演艺公司条件的限制,已经跟不上他们的需求。为了提高选角过程中的决策客观度、提高自制剧选角效率和质量,爱奇艺和优酷等平台纷纷用上了AI。

其中,爱奇艺推出AI选角系统——艺汇选角系统,第一个影视剧成功案例是为《最好的我们》选出男主角刘昊然。

「刘昊然当时作为一名新人,能被AI选中,并能够很成功地演绎这个角色、受大众欢迎,这比较符合选角儿的初衷。」爱奇艺高级总监孙斌说。

媒体曾报道,《最好的我们》男主角余淮,角色标签是开朗、随和、阳光,刘昊然当时的标签是阳光、热情、坦诚,基本符合角色需要。

刘昊然之后,爱奇艺的AI选角系统还为《泡沫之夏》(新版)选出女主角张雪迎。

除了给影视剧选角,爱奇艺的AI还为综艺节目《中国有嘻哈》选出评委吴亦凡、为《中国新说唱》(《中国有嘻哈》第二季)选出评委邓紫棋。

而优酷推出的智能预测平台「鱼脑」,则为《这就是街舞》选出了导师易烊千玺,为《长安十二时辰》选出了主演雷佳音。

上周,我拜访爱奇艺,就「AI如何助力选角」请教了孙斌。而第一个问题,就是被编辑部的小姐姐们千叮咛万嘱咐要问——

「吴亦凡当评委究竟是怎么被AI选出来的……」

因此,我首先向孙斌抛出了这个问题。

1 吴亦凡和邓紫棋:被AI选中的人

「吴亦凡为什么契合那个节目,适合做那个节目的评委?邓紫棋为什么适合第二期的评委?得从这档节目说起。」

因为,做这个节目也是AI分析之后给出的结果,「用的算法原理和选角比较接近,就是大数据看用户行为。」他表示。

首先,他们通过分析爱奇艺站内的用户行为,发现嘻哈类节目有很多搜索和观看,进而了解到——爱奇艺站内有相当大数量的用户对嘻哈类的音乐有强诉求。

接着,圈定喜欢嘻哈音乐的用户,分析这部分用户的行为。

爱奇艺站内每个用户的行为我们都知道,不管是观影行为、互动行为还是其他什么行为。」孙斌介绍。

除了爱奇艺主站,爱奇艺还有奇巴布、爱奇艺泡泡、漫画、文学、VR等20多款应用服务产品。单就爱奇艺视频而言,就有27个频道。



「同时,我们也能以合理合法的手段和方式去拿到这部分用户在站外的行为特征,比如,他们在主流的社交媒体上的行为。」

通过对用户行为的综合分析,能够得知「用户有什么样的行为,喜欢什么样的明星,喜欢的明星中哪个占比高,付费意愿高不高」等信息。

机器和算法在对爱奇艺站内每一个喜欢嘻哈的用户行为进行分析后,萃取、提炼出「这些人中,粉男性艺人的,粉吴亦凡比较多;粉女性艺人的,粉邓紫棋比较多」的关键信息。

所以,他们最终确定吴亦凡为第一季《中国有嘻哈》评委;确定邓紫棋为第二季的评委,给潘玮柏做搭档。


2 AI选角系统的原理

「选评委不是严格的影视选角概念」,孙斌接着向我介绍了AI选角的原理。

简单理解,AI选角系统就是利用大数据将角色和演员进行匹配。

孙斌说,角色信息和演员信息都是可以自然语言描述的,能够从中抽取出其中最关键的信息,角色和演员也都有标签,能够给出格式化的搜索结果,通过计算二者之间的相似度来判断二者的匹配度。

因此,角色信息电子化和艺人信息电子化就成了AI选角系统运行的重要前提。

「但是艺人这个行业里,特别成熟的电子档案少之又少。」

孙斌蛮看好陌陌和领英给用户做认证的方式,「如果你加的50个人都是你的前同事,那么,想在信息或者title上过度包装也不太可能,但是艺人身份认证在艺人档案这个圈儿里,是比较缺乏的。」

有媒体曾经报道,中国演员副导演协会开发了一个网络选角工作平台「TA艺人」,「但因为功能设置过于单一,这个网络新兴产品上线后,并没有达成预期的效果和影响力。」

此外,获导演冯小刚参与投资的「选角APP」在上线3个月时,号称自己签约了100家经纪公司、10万余名艺人、600多个剧组。




但据使用过该产品的业内导演透露:「APP提供的服务还是太少,也不够实用,主要是以演员作品和照片为主,却都存在失真的问题,通过APP选来见组的演员,大部分都让人失望,一来二去,反而耽误了我们的时间。」

另据一名业内人士透露,虽然现在有十几款选角APP,但是真正圈内的人看一眼就知道只是个壳。里面的艺人质量得不到保证,包括艺人本身的演艺质量和艺人本身形象的准确度。

该业务人士直言,「虽然目前已有的十几个APP,几乎没有一个能跑超过一年的。可能有个别跑两三年的,现在基本上都转型做其他的了,艺人经纪或其他行业。」

为了保障艺人信息质量以及艺人形象的准确度,孙斌团队决定自己建立艺人信息知识库

目前,他们的艺人信息知识库里包含艺人的年龄、性别、身高、经纪人、经纪公司等基本信息、作品信息、商业价值、舆情口碑信息等。

但由于AI选角系统目前只服务于爱奇艺内部和爱奇艺联盟经纪公司的艺人,因此,艺人知识信息库中只包含这部分艺人的相关信息,并非涵盖全网艺人。

3 高质量标签

算法运行的好不好,要看标签打的好不好。

「有机器学习深度学习的过程,就一定有一部分高质量的标签( golden set 或者种子标签)是专业的人打的。

比如,演员(艺人)身上的标签一定是先有专业的选角导演或者这个行业的人来打的,然后机器去学习,从各个角度去分析。」他解释道。

因此,不仅是产品研发时,他们找来专业人士打标签;在系统迭代的过程中,也一直有专业人员的参与。

「我们依赖于艺人相关的简历,那个东西可信性越高,我们的算法就越准。」孙斌说,「但艺人身上的标签来自于经纪人,或者来自于艺人的标准简历。

坦白说,这里面还是有个人的主观因素。

可能经纪人就说这个人漂亮,但是可能90%的人都觉得她没那么漂亮。但这也不能说经纪人提供的简历是错误的。」

为了使得演员、标签更加可信,他们利用计算机视觉,通过分析艺人的视频、照片,从中抽取出一些艺人的特征去验证,如该艺人是否高大。

4 选角APP

为了方便使用,孙斌团队开发了内置AI选角系统的艺汇App,他们现场为我演示了这款APP的使用方法,操作十分简便。

但比较遗憾的是,由于这款app仅供内部工作人员使用,因此不能对外展示app的操作界面,因此请大家对以下整个选角流程进行适当脑补:

首先,我们尝试用这款APP为《破冰行动》的男主角李飞适配合适的演员。

一开始,我在界面上输入对这个角色的要求:17—33岁(演员年龄),缉毒警察等关键词;

然后,再输入对演员的要求,譬如「帅气」、「硬汉」、「型男」、「气质类」、「干练」等;之后,系统便自动开始匹配,并很快给出结果:XXX、XX等在库艺人。

在孙斌看来,匹配出来的艺人确实与男主角李飞形象比较接近。其中一位曾出演过《延禧攻略》,因尚未征得经纪人同意,故此处隐去艺人姓名。

我想要了解更多信息,所以又随意点击某个艺人的头像,然后艺人与角色的匹配度、该艺人的舆情数据、相册视频、演艺经历等详细信息便一一呈现;

当然,你还可以在APP中对几个艺人的爱奇艺泡泡粉丝、微博粉丝以及抖音粉丝等平台粉丝数进行对比。

爱奇艺泡泡是爱奇艺2015年11月正式上线的、以明星为中心的粉丝交流与娱乐资讯整合社区。以明星、电视剧、电影、综艺、动漫、游戏、兴趣等各类圈子为基本形态,聚合具有相同喜好和诉求的粉丝。)

这种操作感觉就和选车时、把几款车放在一起、在各个参数上做比较有点类似。

在体验过程中我有一个很强烈的感受,「在库艺人数」对选角系统的最终结果起到了关键作用。毕竟艺人在不在这个数据库里,决定了文章开头提到的素人演员是否有参与角色选拔的机会。

数据库,是让更多好演员以及不知名演员获得角色的第一道门槛。

爱奇艺自己的经纪公司,爱奇艺合作的经纪公司,几乎都在里面。」孙斌做了进一步解释,

这个工具的目的,就是为了通过AI和大数据的手段,让爱奇艺这些好的剧本、内容,找到最合适与爱奇艺合作的演员。」

产业推荐系统人工智能
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

爱奇艺机构

2010年4月22日正式上线,推崇品质、青春、时尚的品牌内涵如今已深入人心,网罗了全球广大的年轻用户群体,积极推动产品、技术、内容、营销等全方位创新。企业愿景是做一家以科技创新为驱动的伟大娱乐公司。于2018年3月29日在纳斯达克上市。

http://iQIYI.COM
推荐文章
暂无评论
暂无评论~