Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

杜伟原创

大模型的下一步:要高精尖,更要接地气

当下,AI 领域最热门的技术非大模型莫属。提到大模型,你也许会想到高参数、强算力、各种国际级的技术奖项和竞赛佳绩…… 让大家认为数据上的「大」和「强」,就是衡量大模型好坏的标准。

诚然,大模型的竞争力建立在「大」和「强」的基础上,但对于应用端来说,需要将大数据的能力真正落实到需求上,实现实实在在的转化,才是展现大模型真正实力的关键一环。因此,如何将大模型与产业化应用无缝连接,研发出适合具体业务场景的行业化大模型,已成为业界纷纷发力的方向。可是,要实现这个目标,却并不简单。

大模型应用落地,难点在何处?

作为当前 AI 领域的前沿技术,各类大模型在促进产业智能化升级、提升业务流程效率与水平等方面都具有领先性;但到了实际应用环节,依然面临很多难题,如技术能力与业务目标不适配、技术无法及时响应业务需求、基建承载能力弱等。

以往,前沿技术都是先做好应用模块,再在具体场景下做 “本地化适配”。而今时今日,技术要想在业务中得以落地,无论是数据收集,还是算法架构,都需要更加前置地考虑如何贴合真实业务需求、如何达成广告主目标,才能将这些思考进行充分表达。因此,为了让大模型更好地落地,技术团队首先要充分了解业务特性或目标,从而结合实际业务强化技术能力持续磨合与进化,做到一切以为业务服务为目标。

此外,谈到业务场景,尤其是广告业务的场景,基于不同行业、不同业务类型,他们的诉求也存在不小的差异。大模型需要实时掌握这些需求,并对此作出快速的响应。这个道理固然简单,但要落实到技术层面,却需要一个相当漫长、复杂的调试和部署周期,往往导致技术迭代落后于业务变化。因此,如何提升大模型的灵活性与敏捷性,能够适配业务需求的调整和变化,成为了建模的重要抓手之一。

总的来说,解决大模型落地难题的关键在于跨越大模型能力与真实业务场景之间的「鸿沟」。如果能以业务目标及动态需求为导向,并满足具体业务运行所需的各项能力,大模型才有可能真正实现落地

要真正满足以上的要求,大模型就需要拥有强大的学习能力,能够通过超大规模的样本训练,锻炼出快速的理解和良好的推理能力。这意味着,大模型的稳定运行需要强大基建支持。然而现实往往是大模型技术到位了,基建没有跟上,多数系统承载不下,大模型只能停留在实验室层面。因此,建设支撑大模型在线训练、推理与部署的计算平台至关重要。

抓住广告业务痛点,腾讯实现大模型又好又快落地

在各家纷纷推广自家大模型的时候,我们注意到了腾讯广告的独特身影。此前,我们就曾在《大厂的广告系统升级,怎能少了大模型的身影》一文中介绍过腾讯广告的混元 AI 大模型与广告大模型,见证了它们强大的技术能力。而我们最近了解到,这两个模型已在具体广告场景得到了应用,真实服务广告主们。

大模型落地困难重重,腾讯广告如何克服以上难点,将前沿技术融入广告业务?今天我们将从业务痛点出发,逐步拆解腾讯广告以终为始的 “技术提效” 思路。

买化妆品的一定是女性?大模型向 “交易” 进化,找到真正对的人! 

互联网广告业务场景本来就具有复杂多变的特点,可谓是大模型应用价值的最佳试金石。随着企业产品的推广竞争越来越激烈,内容营销早已经不止于简单的性能介绍,而需要从人群、地域、话题、商品特性等等层面找到相互融合之处,才能有效吸引消费者的关注及达成转化,从而真正帮助广告主实现生意增长。然而,当下互联网广告场景的参数体量已经非常大,广告业务也正在往短平快、多触点、全域链接的方向迅速发展,这都对广告系统的快速挖掘、灵活匹配提出了更高的要求。此时,广告系统的运算能力就发挥不可或缺的作用。

针对这些业务痛点,腾讯广告打造混元 AI 大模型与广告大模型,全面提升广告系统的理解能力与运算能力,从而帮助广告主实现生意的高效增长。

作为在中文语言理解测评基准 CLUE、多模态理解领域国际权威榜单 VCR 以及 5 大国际跨模态检索数据集榜单(如 MSR-VTT 等)上登顶的业界领先大模型,混元 AI 大模型具备强大的多模态理解能力,可将文字、图像和视频作为一个整体来理解,将广告更精准地推荐给合适的人群,在广告投放过程中实现更快速的起量。

对于广告主而言,在投放中 “起量” 非常重要。当点击率、转化率在短时间内达成了广告主预设的目标,就意味着起量了。混元 AI 大模型的多模态理解能够快速解析出广告素材中的商品名称、规格等丰富的信息,并据此推荐给更可能对此广告感兴趣的人群

我们以润百颜为例,以往这类美妆护肤类广告,都是由优化师们基于品牌对于目标受众的理解,主动选择人群标签进行广告投放。以这个流程进行投放,广告系统并不需要理解广告主真实的营销诉求。然而,如果假定润百颜的主要目标受众为 20-40 岁的女性,那么会购买此产品送给女性朋友的男性就会在投放过程中被排除在外。 

为此,腾讯广告通过与广告主合作引入行业专业知识,进一步细化商品特征,构建全面的美妆行业知识图谱,收集并绑定相同产品的不同素材进行投放。结果显示,当新素材出现时,同产品其他广告积累的数据帮助系统更快更稳健地完成起量。同时,通过打通单一广告主账户下的所有账号实现一体化商品管理,从统一视角聚合商品投放及投后数据的管理,降低整体空耗率。

从更好地理解商品开始,帮商品更快地匹配到对应的消费者,广告大模型强大的运算能力就是提升推荐效率的关键。从参数来看,广告精排大模型的单模型推理参数达到千亿级别,序列化后大小可达数百 GB,浮点数计算量最高每秒超过 10 亿次,在行业位于先进水平。

在广告大模型运算能力的支持下,腾讯广告实现了以系统为主导的全域搜索,能够更快地搜索并挖掘用户与商品的潜在关系,大大提升人货匹配效率,找到更多高成交人群。

可以说,两大模型的加持让广告系统更懂货、更懂广告主生意逻辑、更快找到潜在受众。事实也证明,这套方法行之有效,润百颜的转化起量率提升了 25.43%,空耗率降低了 43.68%,高信息度商品下单 ROI 提升了 5%。

图片

大模型 + 强算力,支持定制模型 7 天上线,快速响应广告主诉求

通过混元 AI 大模型获得了更丰富的特征以后,就可以联动广告大模型进行更准确、更高效的建模了。不仅如此,广告大模型本身也可作为一个通用底座,构建更多灵活的定制模型,适配各种应用场景。这就为满足不同广告主的差异化、精细化需求打下了基础。

在处理广告主实际广告业务过程中,腾讯广告采用了大模型 + 定制模型的技术思路,一方面充分发挥广告大模型的强运算能力,提升数据运算的精度、维度与速度;另一方面依托广告大模型快速搭建业务相关的定制化模型,满足多样化需求,做到有的放矢,帮助广告主更快地完成投放目标。

对于游戏、网服等线上服务类广告主而言,传统投放平台上能够提供的推广目标往往无法满足他们非常精细的投放诉求。以某个网服广告主为例,他们对出价的差异化要求精细到了「通关 3 次」和「通关 5 次」。此外,流量规则与转化路径的区别也使得每个行业、每个广告主要求用户完成不同的转化行为。以游戏行业为例,超休闲和中重度游戏对用户行为要求不同,前者要求用户看完一次激励视频即完成转化,后者则需要用户成功下载、上手玩甚至付费才算完成转化。

为了更快更灵活地响应广告主的差异化诉求,跟上业务变化脚步,腾讯广告选择在大模型上建定制模型,与该网服广告主共同定义促成生意增长的用户关键行为和关键目标,并以「关键行为」为优化目标进行独立建模。

但是,从沟通建模到跑通行业定制模型,难度很高,所需时间也颇长。在广告大模型运算能力的加持下,腾讯广告得以实现快速建模,将模型上线时间从业内普遍的两个月缩短至了 7 天,并在 30 天内完成优化迭代,同时做到及时、准确响应广告主的具体业务需求。

有了大模型助力,网服广告主抢占了流量先机,最终买量 ROI 提升了 20%,平均出价和 eCPM 提升了 50%。

图片

修炼内功 —— 太极机器学习平台提供强大基建

亿级用户、海量广告内容对广告平台的承载和计算能力提出了更高要求,腾讯自研的太极机器学习平台支持 10TB 级模型训练、TB 级模型推理和分钟级模型发布上线,为两大模型在业务场景实现 7×24 小时顺利运行提供了强大基建,保障了混元 AI 大模型、广告大模型的快速、稳定运行。

目前,腾讯广告系统已完成了全面升级(如下图)。底层数据生态(营销数据和经营数据)提供了系统持续运行所需的「源动力」,而一大平台、两大模型强化了系统的理解与运算能力,从而高效达成广告主最关心的三大效果指标 “起量、成本和稳定性”。

图片

升级后的腾讯广告系统为更好地满足广告主诉求、持续优化用户体验构建了坚实可靠的技术底座,在广告业务场景中真正实现了技术提效。

结语

无论是利用混元 AI 大模型强化理解能力,还是通过广告大模型提升运算能力,腾讯广告读懂了如何将大模型落地到业务场景的关键,并摸索出了一套独特的打法。这为业界其他大模型玩家提供了应用参考范式,即始终围绕业务痛点做深文章,充分释放已有能力,并通过积极变招满足广告主变化的真实诉求。

两大模型的落地践行了腾讯广告 “技术提效” 理念。未来,腾讯广告将继续强调技术落地的重要性,从技术的角度理解业务,从业务的角度审视技术,让技术演进推动业务增长,为广告主创造更多的价值。
入门大模型
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。

http://www.tencent.com/
相关技术
跨模态检索技术

指融合不同模态进行检索,通过利用不同模态的互补信息达到提高检索准确率的目的。跨模态数据呈现底层特征异构 、高层语义相关的特点。如何表示底层特征 、怎样对高层语义建模以及如何对模态间的关联建模 ,这些都是跨模态检索面临的挑战。

推荐文章
暂无评论
暂无评论~