Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AI在爱奇艺商业广告中的应用和探索

业务背景

广告是互联网流量变现的重要手段,是驱动工业界大规模 AI 技术应用与研究最重要的场景之一。伴随着爱奇艺各项业务的快速发展,爱奇艺的广告业务也已达到百亿级规模。按广告推广目标的不同,爱奇艺广告业务分为品牌广告和效果广告。品牌广告主要出现在用户观看视频正片前,这个位置用户关注度高,可以帮助广告主快速接触大量用户,宣传品牌形象。效果广告主要出现在信息流,这个位置广告展现形式和上下文内容一致,通过个性化推荐技术广告主可以获得更好的直接转化效果。下面分享一下团队在广告算法系统搭建过程中的一些经验和总结。

爱奇艺广告算法系统框架

广告变现的基本逻辑是流量*单位价值*售卖率,随着流量红利的逐渐消失以及广告主对精准投放的进一步要求,广告售卖不断向精细化运营转变,AI技术在其中扮演着非常重要的角色。为了更好的支持业务发展,我们搭建了一套智能广告算法系统:

图1 爱奇艺广告算法系统框架

• 对于广告主,通过AI技术提供丰富的智能投放工具,帮助广告主提升运营效率和投放效果;

• 对于平台,通过智能库存分配和个性化推荐最大化广告分发效率;

• 对于用户,在保证基本商业利益的同时不断优化广告观看体验,构建更加健康的广告生态;

接下来挑选几个典型的案例为大家进一步介绍我们搭建的这套智能系统:

智能出价

在效果广告的场景,最终的展现机会采用eCPM(eCPM=bid*pctr*pcvr)竞价的方式,每次广告展现的计费价格都会随着竞价的激烈程度动态变化。

图2 竞价网络广告展现机会

对广告主而言,只有设置合理的出价才能在保证成本的前提下获得足够的曝光机会。为了帮助广告主更好的出价,我们运用机器学习技术实现了一套智能出价算法。这套算法的基本原理是:

  1. 采用KNN的方法从历史订单中寻找相似订单;

图3 基于广义KNN的相似订单查找

2.存在相似订单,则使用历史订单数据拟合出价和曝光的相互关系,并给出建议出价;

3. 不存在相似订单,则使用XGBoost从更广阔的样本空间中探索建议出价;

图4 基于XGBoost的出价预测

库存分配

在品牌广告的场景,广告的售卖采用合约的方式,缺量需要对广告主进行补量赔偿,平台的库存分配能力对广告库存的利用效率有极大的影响。

图5 品牌广告库存分配示例

不同于个性化推荐每次请求相互独立,库存分配是一个NP难的全局优化问题。为了达到每次请求实时决策、全局最优的效果,我们设计了一套离线+在线的库存分配系统。离线通过库存预估精准刻画未来库存结构,基于离线构造的分配二部图可以进行库存预分配。在线除了执行离线产生的分配策略外,还通过订单的实时执行进度动态校准离线预测偏差。

图6 库存分配系统

库存预估是库存分配的一个核心问题,我们基于ARIMA、LSTM实现了一套精准的库存预估算法,能准确的预测不同维度组合下未来一段时间的广告库存。

      图7 库存预估算法

TrueView

TrueView是一种创新的视频广告形式,用户可以按照自己的意愿选择是否观看广告,广告主只需为超过30s的用户观看买单,不需要为选择跳过的用户支付广告投放费用。

图8 TrueView广告形式

TrueView在帮助广告主提升广告的有效触达率的同时,降低了用户因为不相关广告流失的可能性。在平台侧,只有实现一套精准的TrueView预估算法,才能减少因用户跳过广告造成的库存浪费。为了有效提升平台整体TrueView率,我们实现了一套基于用户分类的TrueView算法。

图9 基于用户分类的TrueView算法

在模型这块,我们除了尝试LR、GBDT、FM等传统机器学习模型外,还实现了一套基于Wide&Deep的深度模型,并取得了不错的效果提升。

图10 基于Wide&Deep的TrueView模型

展望未来

AI能力使得广告营销智能化,广告和潜在消费者的匹配更加高效。在广告的场景,大多数模型基于机器学习技术,需要足够的用户反馈数据辅助提升算法效果。随着NLP、图像、视频内容理解技术的进一步发展,以及和广告业务的深度结合,未来AI可以帮助我们强化对用户和内容的理解,进一步提升广告与用户、广告与视频内容的关联性。

爱奇艺技术产品团队
爱奇艺技术产品团队

爱奇艺做一家以科技创新为驱动的伟大娱乐公司,用大数据指导内容的制作、生产、运营、消费。并通过强大的云计算能力、带宽储备以及全球性的视频分发网络,为用户提供更好的视频服务。

产业爱奇艺广告应用机器学习LSTMXGBoost算法
3
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

提升算法技术

Boosting是一种主要用于减少偏差的机器学习集成元算法,也是监督学习的一个变化,是一种将弱学习器转换为强学习器的机器学习算法家族。 Boosting是基于Kearns和Valiant(1988,1989)提出的问题:一组弱学习器能创造一个强大的学习器吗?一个弱的学习器被定义为一个分类器,它与真实的分类只有轻微的相关性(它可以比随机猜测更好地标注示例)。相反,强大的学习器是一个与真实分类任意相关的分类器。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

长短期记忆网络技术

长短期记忆(Long Short-Term Memory) 是具有长期记忆能力的一种时间递归神经网络(Recurrent Neural Network)。 其网络结构含有一个或多个具有可遗忘和记忆功能的单元组成。它在1997年被提出用于解决传统RNN(Recurrent Neural Network) 的随时间反向传播中权重消失的问题(vanishing gradient problem over backpropagation-through-time),重要组成部分包括Forget Gate, Input Gate, 和 Output Gate, 分别负责决定当前输入是否被采纳,是否被长期记忆以及决定在记忆中的输入是否在当前被输出。Gated Recurrent Unit 是 LSTM 众多版本中典型的一个。因为它具有记忆性的功能,LSTM经常被用在具有时间序列特性的数据和场景中。

XGBoost技术

XGBoost是一个开源软件库,为C ++,Java,Python,R,和Julia提供了渐变增强框架。 它适用于Linux,Windows,MacOS。从项目描述来看,它旨在提供一个“可扩展,便携式和分布式的梯度提升(GBM,GBRT,GBDT)库”。 除了在一台机器上运行,它还支持分布式处理框架Apache Hadoop,Apache Spark和Apache Flink。 由于它是许多机器学习大赛中获胜团队的首选算法,因此它已经赢得了很多人的关注。

推荐文章
暂无评论
暂无评论~