AutoPLP在偏好标签中的生产与应用

案例介绍

偏好标签行业运营、搜索推荐、广告投放等应用中都发挥着举足轻重的作用,以下图“Cartier/卡地亚”品牌广告为例,需要准确捕捉卡地亚奢品的偏好人群。在这个场景中,它不单纯是品牌的偏好,也不单纯是一个商品或品类的偏好,更像是对该品牌下跨品类的某些商品簇的偏好。AutoPLP基于品牌热词(Cartier/手镯/腕表/戒指/珠宝/砖石/JUSTE UN CLOU/Love ring…)的生产方式灵活实现品牌->品类->商品(或品类->品牌->商品)中间模糊地带的偏好标签生产,可助力卡地亚完成成交目标。

在这里插入图片描述

什么是偏好标签?

在上个场景中,"卡地亚奢品"就是一个偏好标签,那什么标签算偏好标签。

我们优先从电商领域的消费者偏好标签入手,以品所属的行业品牌层次关系为主轴,将电商域的消费者偏好标签重点划分7类:行业偏好、品牌偏好、商家偏好、商品偏好、行业属性偏好、品牌属性偏好、商品属性偏好。其中xx属性偏好:属性指的是一些关键热词/卖点词/趋势词等,包括如功能、功效、材质、风格、颜色、面料、肤质、段位、版型、款式等的描述词。考虑商家偏好、商品偏好、商品属性偏好在应用中与品牌偏好、品牌属性偏好有一定重合之处,所以我们优先以构建类目偏好、品牌偏好、类目属性偏好、品牌属性偏好标签为重点目标。
在这里插入图片描述

AutoPLP是什么

AutoPLP,全称Automatic Preference Label Production System,又名AutoDM-Zero,是AutoDM基于无样本挖掘的一个分支。定位为基于多模态输入的开放式偏好标签生产系统,目标是生产基于多模态输入(文本、图片、视频、音频)的多实体(消费者、商品、企业、POI等)偏好标签。消费者偏好标签是行业运营、搜索推荐、广告投放普遍应用的一类标签,如:消费者手机品牌偏好、装修风格偏好、美妆防晒/保湿/美白功效偏好等等。偏好标签通常可归纳为对于一个实体(如消费者U),预测其对某个关键词label的偏好度。如消费者手机品牌偏好,指U对每个手机品牌label的偏好,label可定义为华为、苹果、小米、魅族、一加、OPPO…,业务物理含义指消费者对华为品牌的偏好度、对苹果品牌的偏好… 。所以偏好标签往往非常离散、个性化,理论上任何有明确语义信息的名词/形容词都可以作为一种偏好标签,它可以来自商品标题、商品属性、潮流词、趋势热词、或业务自定义等等。为满足这种灵活多变多样的特性,AutoPLP的核心能力之一是满足便捷性,实现“定义即生产”。

为什么需要AutoPLP

1)“灵活便捷生产系统”的重要性:随着企业经济体业务的不断发展,我们需要具备结合越来越多源多态的数据来识别愈多实体的能力。以消费者为例,首先消费者的定义在被不断扩大,我们不仅关注他的衣食住行、吃喝玩乐,还关心他在权益、知识、福利、财富、健康等等上的消费。其次消费者的喜好本身在不断变化,毕竟多彩的世界促使每个人都在活出自己想要的Faces Of Girl。所以如何应对这种数据量及内容的时序变化,离不开一套灵活、高产的标签生产系统。

2)“精细化运营”的迫切性:精细化运营不算一个新概念,但当前仍处于一个“人人都知道要做精细化运营,但很多时候往往无能为力”的阶段。以消费者精细化运营为例,类比商品的CPV,我们始终缺失一个相对完整的消费者层次标签体系,也缺失一套快速、灵活的标签生产系统。可以想象,如果我们有了消费者的CPV,一定会是消费者健康度运营,品牌人群资产运营,以及包括像搜索推荐、广告投放等各应用非常重要的“仪表盘”。

3)数据底料的丰富催使”精细化”成为可能:当前时代用户信息数据的丰富和多样,促使精细化成为可能。

AutoPLP技术框架

在这里插入图片描述
AutoPLP定位于实现基于多模态输入(文本、图片、视频、音频)的多实体(消费者、商品、企业、POI等)偏好标签生产系统。整体技术框架如上图,着重解耦为3层:预训练网络、实体embedding以及交互层。围绕这3层,目前我们探索了多种偏好标签生产方式,包括以语义匹配为基础的通用偏好标签生产、面向特定属性商品的偏好标签生产、基于异构图模型的偏好标签生产。

先挖个坑,如果这个文章得到了10个收藏和200阅读量,就来分享下以语义匹配为基础的偏好标签生产实践。