2019奥斯卡还未揭晓,先来看看AI预测的结果

第 91 届奥斯卡金像奖颁奖典礼将于北京时间 2 月 25 日上午 7:30 在美国洛杉矶举行。作为最为重要的年度电影盛会,每年的奥斯卡奖都会吸引全世界的目光。喜欢电影的人总会在结果揭晓前给出自己的预测,不过主观评价并不靠谱,我们应该用上人工智能等新技术。

前不久,官方公布了所有大奖的提名影片,今年的奖项将在这些电影里揭晓:

2019 年奥斯卡奖最重要奖项的提名,图片来自豆瓣。

今年的最大看点似乎就是历史上首次出现在最佳影片提名中的超级英雄电影《黑豹》了,另一个打破惯例的则是由在线内容供应商 Netflix 支持的《罗马》,后者一口气获得了包括最佳电影、最佳导演等大奖在内的 10 个提名。众所周知,Netflix 通过网络提供视频节目,但这种形式对于传统产业造成了一定冲击,不少电影院一直以来都拒绝与其合作,《罗马》当初在美国上映,也是 Netflix 专门租了一些电影院,而这些电影院甚至没有提供票房数据。

BigML:最佳影片难以预测

去年成功预测奥斯卡获奖者后,BigML 决定用机器学习预测今年的奥斯卡奖获得者。不过,今年的结果不太明显。对于一些顶级奖项,机器学习的预测结果显示了谁能拿到梦寐以求的小金人。

Davidlohr Bueso/Flickr.com (http://flickr.com/)

在预测中,技术人员再次应用了标准的机器学习流程:先收集和准备数据集,然后构建和评估模型,最终做出预测。使用 BigML 上的 1-click OptiML 找出最佳模型,我们轻松处理了 100 多个变量,并根据过去获奖的电影确定了模式,然后估计今年的提名。

数据

本周早些时候,BigML 发布了电影数据集,并鼓励用户构建他们自己的模型来预测 2019 年的奥斯卡奖。机器学习模型通常会随着数据实例的增多而获得改进,因此我们保留了前一年为了预测所收集的所有以前的数据和特征,又添加了 2018 年收集到的新数据,总计有 1235 部电影(从 2000 年到 2018 年),其中每部电影有 100 多个特征,包括:

  • 如电影时长、预算和类型这样的特性。

  • IMDB 中的电影评价指标,如投票数量、评分和 Metascore。

  • 今年 20 个主要业内奖项的提名者和获奖者,包括金球奖、英国电影学院奖(BAFTA)、美国演员工会奖(Screen Actors Guild)和评论家选择奖(Critics Choice)。

模型

除了使用 2018 年用过的 deepnet,BigML 今年还用上了 OptiML 和 Fusions。OptiML 是 BigML 上的优化过程,会自动寻找最佳监督模型,而 Fusions 会融合多个监督模型以提高性能。因此对于每个奖项类别,研究者们训练了两个独立的模型,看看预测结果会如何比较,哪种方法会给出最好的结果。

今年,我们的流程是先构建 OptiML,它返回了一系列性能最好的模型,包括 deepnets、ensembles、logistic 回归和决策树。这个强大的方法节省了你手动调整多个监督算法的精力和时间。轻轻点击一下鼠标,我们就可以自动构建和评估数百个模型。从以下截图可以发现,仅用了 16 分钟,OptiML 就评估了 126 个模型。

OptiML 结束后,我们把最好的模型融合在了一起,然后做了批量预测。我们的模型确定了哪些方面对于预测「最佳影片奖(Best Picture)」来说最为重要,如下所示。「Critics Choice won categories」似乎是最重要的指标,占了模型预测的 27%。

奖项预测

最后一步,我们开始预测 2019 年的获奖者。对于每个奖项,我们会预测获奖者和其他提名者的分数。

对于「最佳影片奖」,我们的模型选定的是影片《宠儿》(The Favourite)和《罗马》(Roma)。deepnet 模型选择的是《宠儿》,给出的分数是 37 分。OptiML + Fusion 模型选择的是《罗马》,但其给出的分数是 24,因此 BigML 倾向于 deepnet 模型所做的预测。

对于「最佳导演奖」,机器学习模型给出的预测就更加自信了。它选择了《罗马》的导演 Alfonso Cuarón,给出的预测分数是 70,遥遥领先于其他提名者。

对于「最佳女演员奖」,模型选择的是《贤妻》中的格伦·克洛斯,得分高达 93。

对于「最佳男演员奖」,所有模型的预测结果都指向了《波西米亚狂想曲》中的拉米·马雷克,得分为 96。

对于「最佳女配奖」,机器学习模型也拿不准。虽然选择了艾玛·斯通,但得分仅有 23。看来机器也不是万能的,这个时候准不准就得看运气了。

不过对于「最佳男配奖」,模型就有信心多了。其一致选择是《绿皮书》中的 Mahershala Ali,得分 64。

至于「最佳原创剧本奖」,模型选择的是《First Reformed》,得分 46。紧随其后的是《罗马》和《宠儿》,得分分别是 17 和 16。

最后,模型认为影片《BlacKkKlansman》应获得「最佳改编剧本奖」。

以上就是 BigML 人工智能对于 2019 年奥斯卡部分奖项的预测,在 25 日奖项揭晓时我们可以它看看到底准不准。

微软必应:《罗马》将是最大赢家

即使是人工智能,我们也不要听信一家之言,微软小冰曾经成功预测了莱昂纳多·迪卡普里奥获得奥斯卡奖,让我们看看同属微软的必应今年是怎样预测的。本月初,Bing 放出了根据智能算法预测的 2019 奥斯卡获奖者名单。

与 BigML 有所不同的是,必应预测《罗马》将是今年奖项的领跑者,有 23% 的可能性获得最佳影片奖,而其指导者阿方索·卡隆则有 79% 的可能性获得最佳导演奖。必应还预测今年「罗马」将赢得最多的奥斯卡奖项——它是四大类别的有力竞争者,其中包括最佳影片(23%)、最佳导演(79%)、最佳外语片(83%)和最佳摄影(51%)。

由欧格斯·兰斯莫斯执导的《宠儿》预计将获得三项奥斯卡奖,包括最佳原创剧本(35%)、最佳服装设计(42%)和最佳制作设计(36%)。

拉米·马雷克在电影《波西米亚狂想曲》中扮演传奇乐队 Queen 主唱 Freddie Mercury,与 BigML 的预测相同,他成为了最佳男主角的最有潜力获奖者,获奖几率为 42%。

Lady Gaga 和布莱德利·库珀在电影《一个明星的诞生》中的歌曲《Shallow》最有可能获得今年的奥斯卡原创歌曲,其几率高达 73%。

值得一提的是去年,微软必应预测奥斯卡奖项的准确率为 87.5%,在 24 个奖项中有 21 个预测正确。

参考内容:

https://blog.bigml.com/2019/02/22/predicting-the-2019-oscars-winners-with-machine-learning/

https://www.list.co.uk/article/106901-bing-predicts-roma-will-win-best-picture-oscar/

产业决策树Logistic 回归监督学习
4
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

模型选择技术

模型选择是从给定数据的一组候选模型中选择统计模型的任务。对于具有类似预测或解释力的候选模型,最简单的模型最有可能是最佳选择(奥卡姆剃刀)。

暂无评论
暂无评论~