搜索 | 电商行业模版驱动业务增加实践

简介:阿里巴巴技术专家介绍如何经过开放搜索电商行业加强版,快速构建更高水准的搜索服务,带动业务指数级增加。

讲师:徐希杰--阿里巴巴技术专家java

视频地址:https://developer.aliyun.com/live/246673算法

电商行业模板介绍:https://www.aliyun.com/page-source//data-intelligence/activity/opensearch后端

开放搜索简介

    开放搜索是阿里集团搜索业务中台AIOS体系打造的智能搜索云平台。 目前阿里集团内500+业务接入,主要包括钉钉、盒马、菜鸟口碑等,整个集群在索引的文档数量已经超过了600亿 ,日均的PV已经超过了百亿。在双十一当天查询的QPS分值超过了百万,文档实时更新TPS峰值15万+ ,而且整个服务很是平稳,没有任何降级。在2014年开放搜索正式经过阿里云进行商业化输出。网络

一站式智能搜索业务开发平台

image.png

开放搜索产品优点:架构

  • 相比于开源和自建的搜索,在核心引擎上面更稳定,更高性能;
  • 达摩院多年在NLP领域相关积累,经过查询分析和排序搜索等形式开放,使用户在初始阶段就具有了一个高质量搜索效果;
  • 搜索引导功能支持千人千面;
  • 强开放性,支持多种定制的手段,能够有内置的模型,也能够回流用户本身的模型。
  • 免运维,无需作运维操;

AI.OS引擎系统

image.png

阿里巴巴搜索推荐事业部自研的AI.OS技术体系服务于阿里集团内部90%以上的搜索业务,AI.OS系统天生具备弹性扩缩容,故障快速恢复的能力,比自建或开源的系统更加稳定、更加高效,可以支持海量的数据处理。框架

电商/O2O场景搜索常见问题image.png

电商行业智能搜索系统

query处理流程

image.png

   用户在搜索框中输入查询词,而后后端的系统根据对它进行分析,分析的结果发送给搜索引擎,找到用户想要的商品作排序返回用户最想要的商品,最后将这些商品作一些人工干预,或者是直接最终返回的搜索结果页给用户展现出来。运维

如何构建电商行业智能搜索系统

若是咱们从零开始去构建一个电商行业的智能搜索系统,咱们须要解决哪些问题那?性能

  1. 商品如何建库? 如何准确的理解用户的查询意图?
  2. 如何为用户提供个性化的搜索体验?
  3. 如何根据用户的查询返回最匹配的结果?
  4. 常见的外围功能怎么构建?好比下拉提示、热词、底纹等;
  5. 相关技术人员问题;

开放搜索电商行业模板搜索架构

image.png

商品建库

电商行业模板在应用结构和索引结构上面为用户提供了一个默认的模板。 好比说将商品经常使用的字段抽象成了它的应用结构,而且根据搜索积累,为这些为电商搜索应用建立的对应的,默认的索引结构,用户可能不须要有相关的领域知识就能够建立出搜索系统应用,查询分析和用意图理解方面,而且结合行业的特征作针对性的分词的优化,行业实体识别的优化,同义词纠错的优化和类目预测的优化。优化

查询分析链路

image.png

电商行业分词

分词是影响搜索效果的最基础的模块。开放搜索集成了淘宝搜索同款的电商分词器,训练语料来自淘宝搜索多年积累的百万级有标注的电商行业数据。搜索引擎

分词效果对比:

image.png

电商语义理解

image.png

image.png

命名实体识别

电商NER问题定义

对电商Query和标题进行实体词打标识别其中的品牌、品类、品类修饰、型号、款式等40种类别 ;

难点

  • 品牌更新快歧义大;

例:播(女装品牌)、老爸(食品品牌

  • 品类存在修饰关系 ;

例:华为手机(品类修饰)透明手机壳(品类)

解决思路

  • 现有框架知识库更新

基于老模型链路从新构建全量知识库,F1 69 -> 74

  • 标注训练数据,使用神经网络模型

标注10万条数据,耗时4个月,BiLSTM-CRF模型,F1 74 -> 78

  • 神经网络模型结合知识库

技术创新GraphNER框架结合监督模型与知识库,F1 78 -> 82

image.png

查询分析行业加强版效果

image.png

query改写

  • 文本query

针对查询词处理以后改写的query

  • 个性化query

在查询词改写基础之上引入个性化信息,好比u2i,i2i,u2s2等

  • 向量query

在查询词改写基础之上引入向量信息,须要对查询词进行向量化

多路召回技术

image.png

电商排序

支持两轮排序机制,粗排和精排

粗排参与的文档数量比较多,多是几万到几十万量级,因此对排序的耗时要求比较严格,从而致使它能使用的特征就比较少。

image.png

精排参与的排序的数量比较少,因此打分使用特征能够多一些。image.png

定制排序-Cava脚本

   Cava与排序表达式相比有更高的灵活性和开放性,方便用户自由的定制本身的排序规则,它是开放搜索本身研发的一个类java 的语言,性能和C++至关,支持面向对象的程和即时编译;不一样的数据类型支持类的定义,多种运算符和一些简单的控流程控制语句。

   另一个很重要的部分是在开发语言的基础之上,开放搜索封装了通用的排序特征和为了方便用户开发排序新的排序特征,也封了一些框架类的相关特征。 经过这些特征,用户能够直接在脚本中引用,从而开发出本身新的排序脚本,大大简化了开发成本。

image.png

搜索引导功能

   内置热搜、底纹、下拉提示多样搜索引导算法模型,无需开发系统天天自动训练模型,对用户搜索意图起到重要的引导做用,大大下降后续查询意图理解、相关性、排序、运营干预等环节的调优难度,对提高总体业务目标能够起到很是好的铺垫做用。

搜索前引导:

image.png

搜索中引导:

image.png

电商行业模板实践案例

案例1客户状况:

某电商购物平台, 与淘宝天猫等一线商家合做,每日选择优惠券供用户领取使用,导购电商行业排名前TOP5;

行业模板应用效果

    • 功能和性能远超同类竞品,无结果率降低20%,CTR绝对值提高3%;
    • 工程架构类开发和系统运维人力成本下降,团队成员专一业务开发,帮助业务发展速度更快;
    • 搜索引导成交的GMV显著提高;

image.png

案例2客户状况:

某上市的电商分期购物平台,为年轻人提供正规化、透明化、个性化的消费金融产品与服务;

行业模板应用效果

    • 商品交易额增加:经过搜索服务增长了商品曝光率,带动商品下单转化,转化率同比增加15% 订单转化提高:
    • 从商品详情页到下单页的转化率同比增加20% 接口性能大幅提高;
    • 搜索接口耗时从100ms下降到20ms 使企业可以将资源精力着重投入到用户拉新、升级现金业务等的核心业务上;
    • 弹性扩容,预估容量峰值,知足双十一大促等特殊时段的搜索服务需求;

image

本文内容由阿里云实名注册用户自发贡献,版权归原做者全部,阿里云开发者社区不拥有其著做权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。若是您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将马上删除涉嫌侵权内容。
相关文章
相关标签/搜索