朱林仓

下笔如有神:这是一个基于营销行业的 AI 技术实践

今年京东 618,平台累计下单金额超 2692 亿元,创下了新的记录。惊喜的数字背后, 离不开京东智联云的 AI 技术为用户多元购物体验的赋能。在【发现好货】中 AI 创作的内容是人工创作内容曝光点击率的 1.4 倍。在京小智智能客服,智能生成了数百万营销文案,每天相当于超过 500 个文案编辑人员的工作量。

云妹导读:

随着科学技术日新月异的发展,人工智能已经逐渐走入我们的生活,给我们带来非常大的便利和惊喜。比如京鱼座智能音箱,动动嘴就可以听歌、购物、控制空调、冰箱;在京东购物可以享受京小智智能客服带来的24 小时不间断服务;如果你点开京东 APP 的【发现好物】频道,还可以看到由 AI 创作出的精彩内容导购。

今年京东 618,平台累计下单金额超 2692 亿元,创下了新的记录。惊喜的数字背后, 离不开京东智联云的 AI 技术为用户多元购物体验的赋能。在【发现好货】中 AI 创作的内容是人工创作内容曝光点击率的 1.4 倍。在京小智智能客服,智能生成了数百万营销文案,每天相当于超过 500 个文案编辑人员的工作量。

“读书破万卷,下笔如有神”,当机器书读万卷的时候,能否做到下笔有神呢?

我们正在经历一个节奏越来越快的时代,互联网上的信息来也匆匆去也匆匆,各行各业涉及到高频内容生产和处理工作的都希望内容生产的速度快、质量高、数量多。而随着人工智能技术的发展,让机器辅助人类更高效地处理信息,以及让机器自动生成信息都已经成为可能。

让机器“下笔如有神”,涉及到的就是自然语言处理(NLP)技术了,其实依据 NLP 让机器帮助人工写作的技术早已不是新鲜事,前两年人工智能最火热的时候,关于 “AI 写新闻稿,记者要失业”、“AI 写剧本,编剧要下岗”等新闻甚嚣尘上,对于 AI 导致文字工作者失业的讨论也是学术界、产业界喜欢探讨的话题。

对于这种技术能力,在市场上我们常听到的称呼则是「智能写作」,它可以广泛应用于各种业务场景中。

我们以电商场景为例,在电商产品页面,通过点击商品标题、商品详情,到最终的下单行为,图文的感染力是左右用户的实在原因,而且随着电商平台体量增大,必然会面临需要更快更优质的内容以实现电商转化率地提升。但人工写作很难满足电商场景的效率和成本要求,「智能写作」这时候就可以发挥出独有优势。

那么「智能写作」在京东有哪些应用?涉及到哪些关键性技术?其在京东 618 又发挥了什么作用呢?带着这些问题,我们采访到了京东智联云平台产品经理,自然语言处理与智慧内容营销产品负责人朱林仓。

关于采访嘉宾

朱林仓,京东智联云平台产品经理,自然语言处理与智慧内容营销产品负责人,主导商品营销智能创意产品规划设计,《特种机器人》作者。擅长将电商营销管理与人工智能技术深度融合,专注主观感性业务的数据化、结构化与智能化的产品设计。

智能写作在哪些场景下占优势?

什么场景适合让机器代替人工?重复性的劳动。在写作这件事上,把一些能找到规律的、大批量、短时间内需产出的内容让机器输出,本身对于商业来说,具有成本优势效率优势

从成本角度讲,一个系统一个人操作就能生产出 10 倍于人工的营销文案,这样的场景中技术是一定占优势的,而且当前的技术能力已经达到了替代部分人工的经济可行性和技术可行性。

从效率角度讲,机器能够通过数据分析,通过更精细的数据挖掘维度和非结构化营销内容的数据化与结构化,有效提升营销转化率,进而提升单位流量成本下的 GMV 收益。

所以智能写作在电商场景中的应用是非常占优势的。同时也解决了品牌方、消费者和内容生产方三方的难题:品牌方所投放内容转化订单金额提升困难、消费者面对导购内容与商品不一致的平台使得选择成本增高,体验变差、内容生产方人工成本居高不下,资料搜集时间长,内容审核修订,素材产出效率低。

目前,京东的「智能写作」更多应用在自身平台——京东APP上:京东【发现好货】频道、京小智智能客服、京东搭配购、社交电商京粉、人机交互写作等。

京东 APP【发现好货】频道▲

京东 APP【发现好货】频道,很多商品的营销文案都由「智能写作」来生成▲

智能写作能够针对不同群体采用不同营销策略,以及不同风格的营销文案,从而提高营销转化率。具体是如何实现的呢?京东 AI 研究院提出了基于商品要素的多模态摘要模型,论文发表在 AAAI2020 上,可基于商品要素进行可控的文案生成。

这也得益于京东原创的商品元素体系,首先根据用户的行为(浏览、点击、加购、下单、评论、分享等)识别用户感兴趣的商品要素——根据这些要素指定模型要生成的文案必须包含的商品要素——利用京东提出的基于商品要素可控的文案生成相应文案。

京东 APP,通过 AI 创作的数十万商品营销图文素材,不仅填补了商品更新与达人写作内容更新之间的巨大缺口,也提升了内容频道的内容丰富性。同时,AI 生成内容在曝光点击率、进商品详情转化率等方面,其实都表现出了优于人工创作营销的内容。

另外,在其他的互联网场景中,智能写作也在大放异彩。比如:店铺装修运营、广告创意创作等场景下,将重复工作由 AI 技术完成,创意工作由 AI 构建数据支持和洞察支持,人机协同创作更高效的创意营销内容。还有直播场景下,AI 可以辅助主播创作黄金话术、实时洞察消费者情绪变化与直播间的消费者需求分布等

京东【智能写作】的关键性技术

京东「智能写作」依靠的关键技术就是多模态异构数据自动摘要技术。

通过输入多模态(图片+文本)、异构(结构化商品知识图片和非结构化纯文本)数据,挖掘卖点和商品要素,模型包括多模态的编码器和解码器、预训练语言模型提高文本合规性、句间流畅度模型提高文本逻辑性、标点纠错模型改正标点错误,最终输出商品的营销短文。

在这里,通过解读京东 AI 研究院入选 AAAI 2020 的两篇论文,大家对智能写作涉及到的模型将能有更好的了解。论文标题为:《Aspect-Aware Multimodal  Summarization  for  Chinese  E-Commerce  Products》、《Keywords-Guided Abstractive Sentence Summarization》,分别介绍了基于商品要素地多模态摘要模型和基于关键词指导的生成式句子摘要方法。

关于论文可以点击以下链接了解详情:

*《Aspect-Aware Multimodal  Summarization  for  Chinese  E-Commerce  Products》论文解读

*《Keywords-Guided Abstractive Sentence Summarization》论文解读

基于关键词指导的生成式句子摘要模型介绍

自动文本摘要是 NLP 领域中的一个传统任务,提出于 20 世纪 50 年代,其目标就是基于给定的文本,生成一段包含其中最重要信息的简化文本。常用的自动文本摘要方法包括抽取式自动文摘(Extractive Summarization) 和生成式自动文摘(Abstractive Summarization)。抽取式自动文摘通过提取给定文本中已存在的关键词、短语或句子组成摘要;生成式自动文摘则是通过对给定文本建立抽象的语意表示,利用自然语言生成技术,生成摘要。

京东提出的方法则是融合了抽取式自动文摘和生成式自动文摘,在 Gigaword 句子摘要数据集上与对比模型相比,也取得了更好的性能。

如何让句子“由长变短”呢?京东提出的想法是:输入文本中的关键词可以为自动文摘系统提供重要的指导信息。这一过程就是:首先将输入文本和参考摘要之间重叠的词(停用词除外)作为 Ground-Truth 关键词,通过多任务学习的方式,共享同一个编码器对输入文本进行编码,训练关键词提取模型和摘要生成模型,其中关键词提取模型是基于编码器隐层状态的序列标注模型,摘要生成模型是基于关键词指导的端到端模型。

关键词提取模型和摘要生成模型均训练收敛后,利用训练好的关键词提取模型对训练集中的文本抽取关键词,利用抽取到的关键词对摘要生成模型进行微调。测试时,利用关键词提取模型对测试集中的文本抽取关键词,最终利用抽取到的关键词和原始测试集文本生成摘要。

这其中的重点动作可总结为以下几点:

  1. 通过采用多任务学习框架来提取关键词和生成摘要;

  2. 通过基于关键字的选择性编码策略,在编码过程中获取重要的信息;

  3. 通过双重注意力机制,动态地融合了原始输入句子和关键词的信息;

  4. 通过双重复制机制,将原始输入句子和关键词中的单词复制到输出摘要中。

  5. 在标准句子摘要数据集上,京东验证了关键词对句子摘要任务的有效性。

基于商品要素的多模态摘要模型介绍

商品摘要任务的挑战性在于:一方面,商品给顾客的第一印象来自该商品的外观,这对顾客的购买决策有着至关重要的影响。因此,商品摘要系统必须能够充分挖掘商品视觉信息,反映商品的外观特色。另一方面,不同的产品有不同的卖点。例如,紧凑型冰箱的优点是节省空间,而环保型冰箱的优点是节能。因此,商品摘要应该反映商品最独特的方面,从而最大限度地促成消费者的购买。

 京东 AI 研究院提出的这一电商商品的多模态摘要模型,将商品图像、产品标题和其他产品描述作为输入,生成商品文本摘要。有效地整合了商品的视觉和文本信息。

这里对于文本信息的整合很好理解,那么这一模型是怎么理解图像信息的呢?

京东 AI 研究院提出的这一模型基于指针 - 生成器网络(Pointer-Generator)。采用了三种策略将商品图像信息融入模型中,包括使用商品图片的全局特征初始化编码器,使用商品图片的全局特征初始化解码器,以及使用商品图片的局部特征,通过注意力机制生成图片上下文向量参与解码。

这使得京东的智能写作可以更层次化地理解商品图像。第一,通过 R-CNN 挖掘有价值的局部特征,例如冰箱的面板、手机的屏幕,将其融入到文本解码的每一步中,使模型针对商品有卖点的局部进行描述;第二,通过 ResNet 挖掘商品全局特征,该特征和文本全局特征一起,对编码器和解码器初始状态进行赋值,从而从更多的角度丰富商品的特征,提高商品的可区分度,生成更加多样化的文案。

智能写作给京东零售带来的诸多受益

自 2019 年 2 月底,在【发现好物】的频道内实践智能写作功能,它帮助了京东零售生成多种风格文案,包括属性类描述、体验类描述、官方单品描述、搭配商品描述、社交体等,涵盖京东 2700 余个三级类目。文案人工审核率超过 99%,曝光点击率高出达人写作 40%,累计引单金额超过一亿。

 而且今年京东 618,【发现好货】的 AI 内容导购,AI 内容是人工创作内容曝光点击率的 1.4 倍。另外在京小智智能客服,智能生成了数百万营销文案,每天相当于超过 500 个文案编辑人员的工作量。

在 NLP 基础技术研究上,京东未来将强化电商领域语言模型,强化 NLP 应用技术研究,在商品理解和营销内容理解方面更加深入营销场景。

后续,京东「智能写作」还将覆盖更多题材的内容营销导购频道,将商品营销内容理解能力、卖点挖掘与卖点包装能力,更多的赋能商家店铺装修、广告文案创意等场景。同时在这项能力的迭代上,提供千人千面的个性化文案,短文、长文、直播话术等多题材智能创作、营销内容智能诊断。

京东智联云开发者
京东智联云开发者

京东智联云开发者(JD Cloud & AI Developer)是京东集团旗下为AI、云计算、IoT等相关领域开发者提供技术分享交流的平台。平台将发布产品技术信息、行业技术内容、技术活动及大赛等资讯。拥抱技术,与开发者携手预见未来!

产业618京东智能写作零售NLPAI
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

收敛技术

在数学,计算机科学和逻辑学中,收敛指的是不同的变换序列在有限的时间内达到一个结论(变换终止),并且得出的结论是独立于达到它的路径(他们是融合的)。 通俗来说,收敛通常是指在训练期间达到的一种状态,即经过一定次数的迭代之后,训练损失和验证损失在每次迭代中的变化都非常小或根本没有变化。也就是说,如果采用当前数据进行额外的训练将无法改进模型,模型即达到收敛状态。在深度学习中,损失值有时会在最终下降之前的多次迭代中保持不变或几乎保持不变,暂时形成收敛的假象。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

注意力机制技术

我们可以粗略地把神经注意机制类比成一个可以专注于输入内容的某一子集(或特征)的神经网络. 注意力机制最早是由 DeepMind 为图像分类提出的,这让「神经网络在执行预测任务时可以更多关注输入中的相关部分,更少关注不相关的部分」。当解码器生成一个用于构成目标句子的词时,源句子中仅有少部分是相关的;因此,可以应用一个基于内容的注意力机制来根据源句子动态地生成一个(加权的)语境向量(context vector), 然后网络会根据这个语境向量而不是某个固定长度的向量来预测词。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

自动摘要技术

自动摘要是指给出一段文本,我们从中提取出要点,然后再形成一个短的概括性的文本。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

多任务学习技术

自然语言生成技术

自然语言生成(NLG)是自然语言处理的一部分,从知识库或逻辑形式等等机器表述系统去生成自然语言。这种形式表述当作心理表述的模型时,心理语言学家会选用语言产出这个术语。自然语言生成系统可以说是一种将资料转换成自然语言表述的翻译器。不过产生最终语言的方法不同于编译程式,因为自然语言多样的表达。NLG出现已久,但是商业NLG技术直到最近才变得普及。自然语言生成可以视为自然语言理解的反向: 自然语言理解系统须要厘清输入句的意涵,从而产生机器表述语言;自然语言生成系统须要决定如何把概念转化成语言。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东商城、京东金融、拍拍网、京东智能、O2O及海外事业部等。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作,1号店并入京东。

文本生成技术

文本生成是生成文本的任务,其目的是使人类书写文本难以区分。

推荐文章
暂无评论
暂无评论~