京东商城背后的AI技术能力揭秘 - 基于关键词自动生成摘要

Alt

做者:京东AI研究院算法

导言
过去几十年间,人类的计算能力得到了巨大提高;随着数据不断积累,算法日益先进,咱们已经步入了人工智能时代。确实,人工智能概念很难理解,技术更是了不得,背后的数据和算法很是庞大复杂。不少人都在疑惑,如今或将来AI将会有哪些实际应用呢?
其实,关于AI的实际应用以及所带来的商业价值并无那么的“玄幻”,不少时候就已经在咱们的身边。接下来,【AI论文解读】专栏将会经过相关AI论文的解读,由深刻浅地为你们揭秘,AI技术是如何对电商领域进行赋能,以及相关的落地与实践。人工智能技术在电商领域,有着丰富的应用场景。应用场景是数据入口,数据经过技术获得提炼,反过来又做用于技术,两者相辅相成。

京东基于天然语言理解与知识图谱技术,开发了商品营销内容AI写做服务。并将此项技术应用到了京东商城【发现好货】频道中。网络

经过AI创做的数十万商品营销图文素材,不只填补了商品更新与达人写做内容更新之间的巨大缺口,也提高了内容频道的内容丰富性。机器学习

同时,AI生成内容在曝光点击率、进商详转化率等方面其实都表现出了优于人工创做营销的内容。学习

接下来让咱们一块儿来看看,针对不一样群体采用不一样营销策略及不一样风格的营销文案从而提升营销转化率是怎样经过AI来实现的。ui


与传统的文本摘要任务相比,商品摘要任务更具挑战性。一方面,商品给顾客的第一印象来自该商品的外观,这对顾客的购买决策有着相当重要的影响。所以,商品摘要系统必须可以充分挖掘商品视觉信息,反映商品的外观特点。另外一方面,不一样的产品有不一样的卖点。例如,紧凑型冰箱的优势是节省空间,而环保型冰箱的优势是节能。所以,商品摘要应该反映商品最独特的方面,从而最大限度地促成消费者的购买。编码

本文接下来将介绍由京东 AI 研究院提出的一种电商商品的多模态摘要模型,该模型能够有效地整合商品的视觉和文本信息来生成卖点突出、流畅和简洁的商品文本摘要。人工智能

论文的标题为 :Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products ,发表于 AAAI 2020。spa

论文连接:http://box.jd.com/sharedInfo/2926429040ECC7D33d

Alt

以下图1所示,商品广告含有大量的文字介绍,顾客很难在短期内在这些广告中获取有价值的商品信息,尤为是当顾客想要比较多个商品时,将会耗费大量的时间,影响了购物体验。商品摘要模型能够为商品生成文本摘要,为潜在消费者提供了短期内了解商品的便利。从消费者决策的角度出发,一个好的商品摘要须要反映商品的外观特点和卖点信息,这也是本文提出的商品摘要模型的出发点。指针

在这里插入图片描述
图1

论文提出了一种基于商品要素的多模态商品摘要方法,如图1所示,该模型将商品图像、产品标题和其余产品描述做为输入,生成商品文本摘要。该模型不只能够有效地整合商品的视觉和文本信息,并且从商品要素出发,使生成的商品摘要尽量的包含商品的特点要素,并提升商品摘要的流畅性和简洁性。

论文中构建了一个中文商品摘要数据集,该数据集包含约140万个“商品-摘要”对,涵盖家电、服饰和箱包品类。在该数据集上的实验结果代表,文中提出的模型在自动评价和人工评价指标上都显著优于其余对比方法。

Alt

如图2所示,论文中提出的商品摘要模型基于指针-生成器网络(Pointer-Generator)。采用了三种策略将商品图像信息融入模型中,包括使用商品图片的全局特征初始化编码器,使用商品图片的全局特征初始化解码器,以及使用商品图片的局部特征,经过注意力机制生成图片上下文向量参与解码。
在这里插入图片描述
图2

首先,对商品要素进行建模(所谓的商品要素,就是商品不一样方面的属性。例如:对洗衣机而言,商品要素包括容量和能耗等),而后从商品的要素出发,对摘要的重要性、非冗余性和可读性进行建模。

(1)采用基于商品要素的RAML(reward augmented maximum likelihood)训练,鼓励模型生成的摘要涵盖商品的特点要素。如图2(b)所示,该商品ground-truth特点要素是容量、操控与电机,则该模型将会鼓励生成描述容量、操控与电机相关的文本;

(2)采用基于商品要素的覆盖度机制消除冗余信息。传统覆盖度机制仅能在词维度进行去冗余,难以处理相关词冗余问题。如图2(c)所示,“noise”、“quiet”和“tranquil”均在描述“运行声音”这一商品要素,若是仅对“noise”进行去冗余,难以保证“quiet”和“tranquil”不出现摘要中。本文提出的模型经过商品要素维度的去冗余,能够避免“noise”、“quiet”和“tranquil”同时出如今摘要中;

(3)经过商品要素放回跳机制提升摘要的可读性。如图2(d)所示,商品要素的回跳描述下降了商品摘要的连贯性,影响了消费者的阅读体验。本文提出的模型经过解码时禁用回跳要素词,有效地避免了这一现象。

Alt

如表1所示,本文提出的带有的多模态商品摘要模型,MMPG模型取得了比全部基于纯文本的模型更好的结果,这证实了商品视觉信息和商品要素信息在商品摘要任务中起着重要的做用。

在这里插入图片描述
表1

Alt

论文提出了一个多模态商品摘要模型,其能够利用商品图像、标题和其余文本介绍,为商品生成摘要。文中提出的模型能够有效地利用商品的视觉信息,并反映商品的特点要素,从重要性、非冗余性和可读性的角度对商品要素进行了有效的建模。

对于电商而言,海量商品的营销内容在由达人供稿的过程当中,受限于达人写做的效率限制,商品更新速度明显高于营销内容上线速度,致使内容短缺。

在这里插入图片描述

AI生成内容在生成效率、曝光点击率、订单转化率等方面其实都表现出了优于人工创做营销的内容。该方法正在应用于垂直电商、综合电商、社交电商、新媒体平台等众多场景。

P.S 同时也欢迎对NLP、文本生成和自动文摘感兴趣的小伙伴加入咱们。相关信息咨询,可在后台给咱们留言哦~

京 东 AI 研 究 院
京东AI研究院专一于持续性的算法创新,多数研究将由京东实际的业务场景需求为驱动。研究院的聚焦领域为:计算机视觉、天然语言理解、对话、语音、语义、机器学习等实验室,已逐步在北京、南京、成都、硅谷等全球各地设立职场。

欢迎点击“阅读”了解京东智联云AI研究院!

Alt

Alt

相关文章
相关标签/搜索