检索式chatbot：word2vec/GloVe/fasttext

前言：本文做者@我偏笑，是咱们“AI产品经理大本营”成员，也是“AI研习小分队”的分享嘉宾之一（每4周分享一篇AI产品经理相关的学习心得总结）；欢迎更多有兴趣“主动输出”的朋友们一块儿加入、共同进步：）

序言

以一周前的这条微博做为开始——

一周前我讲：相对的，天然语言解析技术已经逐渐再也不成为各家广义智能助理产品的核心竞争力，识别用户意图以后所提供的服务开始成为对话机器人差别化的核心。

对于一个对话系统而言，我微博中所指的『后续服务』，就是上图中的 DST（对话状态维护）以及 Policy（动做候选排序），或者统一的称其为 DM（Dialogue Mannagement，对话管理）。也即，当接收到 NLU 模块的输出、其余场景及用户特征信息以后，判断系统应该跳转到什么状态，以及执行什么样的动做。

产品角度，DM 是对话机器人封闭域多轮对话体验的核心，正是一次次 DST + Policy 造成了人机间的多轮对话体验。（注：我我的倾向于将“识别用户意图以后，为了获取必要信息，与用户进行的有目的的多轮对话”称为封闭域多轮对话，区别于识别用户意图以前，为了利用上文信息，所采用的『上下文替换』、『主体补全』等技术，也即开放域多轮对话。下文提到的『多轮对话』，均指封闭域多轮对话。）

既然多轮对话在对话机器人类产品体验中扮演着如此重要的角色，我便开始思考：一个架构完备的多轮对话体系应该是什么样的。也即，多轮对话系统中，至少须要包含哪些模块，才能为用户提供一种与人人对话相去不远的人机对话体验。

1、多轮对话

多轮对话定义

我有个习惯，就是在构造一个复杂系统以前，先从纷繁的细节之中跳出，尝试抽象的描述整个系统，及系统中的各个模块，也即为它们『下定义』。这能帮助你在多种可行方案中作出选择，也即帮你明确：什么该作，什么不应作，什么该谁作。

基于以上思想，我尝试先给出几个我我的对于多轮对话体系定义问题的回答——

基本定义：什么是多轮对话？ （封闭域）多轮对话是一种，在人机对话中，初步明确用户意图以后，获取必要信息以最终获得明确用户指令的方式。多轮对话与一件事情的处理相对应。

补充说明1：所谓『必要信息』必定要经过与用户的对话获取吗？ 不必定，即使是人与人之间的交流，对话自己所包含的信息也只占总传递信息量的小部分，更多信息来源于说话人的身份、当前的时间/地点等一系列场景信息。因此多轮对话的信息获取方式，也不该当只局限于用户所说的话。

补充说明2：多轮对话必定在形式上表现为与用户的屡次对话交互吗？ 不必定，若是用户的话语中已经提供了充足的信息，或者其它来源的补充信息已足够将用户的初步意图转化为一条明确的用户指令，那就不会存在与用户的屡次对话交互。

以上，是针对多轮对话总体定义问题的回答，每一个模块的相关定义会在下文尝试给出。

2、槽

一、槽（slot）

基本定义：什么是槽？ 槽是多轮对话过程当中将初步用户意图转化为明确用户指令所须要补全的信息。一个槽与一件事情的处理中所须要获取的一种信息相对应。

补充说明：多轮对话中的全部的槽位都须要被填充完整吗？ 不必定，以以下对话为例——

我：『去萧山机场多少钱』

出租车司机：『70』

对话中的『70』，应当被理解为70元人民币，而没必要再去追问：『你说的是人民币、美圆、日元仍是港币？』。这类信息应当以默认值的形式存在，也即槽有必填与非必填之分，与上文所说的『信息未必须要经过与用户的对话获取』相对应。

二、词槽与接口槽

上文反复的提到，对话内容并非获取信息的惟一方式，用户身份以及当前场景也包含着大量值得被利用的隐含信息。因此，与此相对的，一个完备的多轮对话体系应当同时具有从用户话里以及话外获取信息的能力。

我我的将“利用用户话中关键词填写的槽”叫作词槽，“利用用户画像以及其余场景信息填写的槽”叫作接口槽。

举个例子，我讲『我明天要坐火车去上海』。其中，分别将『明天』、『上海』填入名为『出发时间』、『目的地』的词槽中，而我当前所在的位置，则填入到了名为『出发地』的接口槽中。

三、槽组与槽位

我我的将“利用用户话中关键词填写的槽”叫作词槽，“利用用户画像以及其余场景信息填写的槽”叫作接口槽。

举个例子，我讲『我后天要坐火车去上海』。其中，分别将『后天』、『上海』填入名为『出发时间』、『目的地』的词槽中，而我当前所在的位置，则填入到了名为『出发地』的接口槽中。

不知道上文错的如此离谱的结论，有没有引发你的注意：）

仔细读一遍上面举的例子，就会发现一个很严重的矛盾点：难道『出发地』这个槽不能由用户指定？用户彻底能够说『我后天要坐火车从北京去上海』，那它是词槽仍是接口槽？并且更进一步的，难道只能用『我当前所在的位置』来填入『出发地』这个槽中？好比，若是能读到个人日程表，发现我明天会去杭州，那是否是就应该用『杭州』而不是『我如今所在的位置』来填『出发地』这个槽了？

从中咱们能发现什么呢？同一个槽，可能会存在多种填槽方式。

我将可能包含多种填槽方式的槽称为槽组，槽组下面可能存在任意多个槽位，也即任意多种填槽方式，而每一个槽位又都对应着『词槽』与『接口槽』两种槽位类型之一。

本质上来说，槽组（也即上文中提到的『槽』），对应着一种信息，而几乎不会有哪一种信息的获取方式只有一种。因此一个『槽』会同时对应多种填槽方式也就是天然而然的了。

依照上文，同一种信息会有多种获取方式，也即同一个槽组会对应多种填槽方式（槽位）。那不一样填槽方式之间必然会存在优先级的概念。

就如同上文『订票』的例子，『出发地』槽包含三种填写方式，一种词槽、两种接口槽，天然的，词槽的优先级最高，『日程表中隐含的出发地』次之，『我当前所在的位置』再次。

若是将其与前文提到过的必填/非必填结合起来，其填槽过程应当遵循如下步骤：

尝试填写词槽
若失败，尝试填写第一接口槽『用户日程表中隐含的出发地』
若失败，尝试填写第二接口槽『用户当前所在位置』
若失败，判断是否该槽必填
若必填，反问用户，重填词槽 *若非必填，则针对该槽组的填槽过程结束

咱们须要知道，必填/非必填在逻辑上与槽组而不是槽位平级，只有信息才会分为必要/非必要，填槽方式不作这种区分。并且是否必填实际上与接口槽无关，只取决因而否须要与用户进行交互。

四、澄清话术

与槽组（也即与一种信息）平级的概念还有一个，叫作澄清话术。

澄清话术是对话机器人但愿获取某种信息时所使用的问句。好比『目的地』对应的澄清话术就是『您想从哪出发呢？』，『出发时间』对应的澄清话术就是『您想什么时间出发呢？』。

显而易见的，澄清话术与槽组而不是槽位平级。

五、槽的填写

上文讲到，一个槽组可能会有多个槽位，槽位存在词槽与接口槽之分。

先说词槽。

词槽信息的抽取其实仍是有些麻烦的，不过这属于解析的问题，不在本文探讨的范围内，这里只是简单提一下，举两个例子：

用户表达『不』，可能会有『不行』、『不是』、『算了』、『没有』等一系列说法。
用户话中有多个符合条件的关键词，咱们整套多轮对话中有多个槽，每一个槽填一个仍是多个值？哪一个槽与哪一个词对应？

同义词典、规则、双向LSTM+CRF，各有各的方法。

再说接口槽。

接口槽与词槽相比，额外存在一个问题，就是：接口返回的结果就是用户须要的结果吗？

这里须要分红两种状况来讨论，一种是：咱们明确知道接口的返回值能够直接填入槽位（不是槽/槽组）中，不须要向用户确认。

特别的，这里还要明确一点，即使是上述状况，也并不意味着当前槽/槽组只有该特定接口槽这一个槽位。有两种状况存在：一种是该槽组下只有这一个槽位，该接口的返回值直接填入槽位中，也至关于填入了槽/槽组中；或者该槽位下有多个槽位，接口槽的填入值并不必定最终做为槽/槽组的填入值。

另外一种是：咱们知道接口的返回值只能做为参考，须要用户的协助才能进行槽位的填写。

这种状况下，须要提供选项，让用户最终决定该槽位的填入值，与词槽同样，这里一样须要处理单值/多值的问题。单值/多值在逻辑上与槽组平级。

此外，这里还要注意一个否定选项的问题，好比我对阿里小蜜说，我忘记密码了，它会经过接口拿到个人当前帐号，而后将其提供选项给我，问『你是忘记了哪一个帐号的密码？』，不过，除了我当前帐号以外，还有一个选项也被提供出来了，就是『不，不是这个帐号』。

这表明了一类问题的存在，用户的意图并不必定包含在接口的所有返回值之中。因此就必然会有这样一种相似『不要/不是/不』的选项，我将其叫作否定选项。

用户选择否定选项后，即意味着该槽位的填写失败了，须要填入一个特殊值表明失败。用户选择否定选项的失败，能够与接口调用失败等其它意外状况合并处理，由于这都意味着该槽位填写失败，意味着该种信息获取方式未能成功获取信息。

若是该槽组下只有这一个槽位，这个特殊的失败表征值就应看成为整个槽组的填入值，若是还有其余槽位值，则根据槽位间优先级最终肯定槽组填入值。

六、平级槽和依赖槽

上面说到底都在讲一个槽组的填写，也即一种信息的获取，但多轮对话的目的是将初步用户意图转化为明确用户指令，这其中所须要的信息一般都不仅有一种。

谈完了槽组与槽位之间的关系，接下来谈一下槽组与槽组之间的关系，也即信息与信息之间的关系。

为了便于理解，我先举两个例子来表明两种多轮对话中所包含的极端状况。

第一种：订车票，你须要知道用户出发的时间、地点、目的地、座位种类。这四个槽组之间，没有任何依赖关系。换言之，你只须要肯定好这四个槽组中必填槽组之间的澄清顺序，接收到用户问句后，对还未填充完成的必填槽组依次进行澄清便可。我将这四个槽组之间的关系称为平级槽关系。

另外一种，不知道读者玩没玩过橙光，或者其它多结局的剧情类游戏。它们的特色是什么呢？每个选择都会有影响到后续剧情发展也即 每一个槽组的填写结果会影响其它槽组的填写。换言之，部分槽组依赖前序槽组的填写结果，在其依赖的前序槽组填写完成以前，该槽组都没法进行填写。我将槽组间的这种关系称为依赖槽关系。

这种状况下，整个多轮对话过程就造成了一棵树，极端状况下，这棵树是满的。树上的每一个节点放置着一个会对后续对话走向产生影响的槽组。

槽关系的选择要根据实际业务场景来肯定。

若是错将平级槽采用依赖槽关系来管理，就会出现信息的丢失。好比 A、B、C，三者本为平级槽关系，但却将其用 A->B->C 的依赖槽关系来管理，那即使用户问句中包含填写 B、C 槽组的信息，也可能会因为 A 槽组的未填写而形成 B、C 槽组的填写失败。

若是错将依赖槽采用平级槽的关系来管理，就会出现信息的冗余，好比 A、B、C三者的关系为 A、A1->B、A2->C，那即使用户将值 A1 填入槽组 A 后，却仍然须要向用户询问本不须要的 C 槽组的填写信息。

上述两种状况属于全平级槽关系与全依赖槽关系的特殊状况，在实际的业务场景中，这两种关系会是同时存在的，不一样槽组间，既有平级槽关系，又有依赖槽关系。

实际业务场景中，完整的多轮对话过程一般会以树的形式存在，每一个节点存在一个或多个槽组，用于获取一种或多种信息，节点间的槽组为依赖关系，节点内的槽组为平级关系。

上文将多轮对话定义为一件事情的处理，槽组/槽定义为一种信息的获取，槽位定义为信息的一种获取方式。这里我倾向于将多轮对话树结构中的一个节点定义为处理事情的一个步骤。

一件事情的处理包含多个步骤，每一个步骤中须要补全一种或多种信息，每种信息存在一种或多种获取方式。

上述定义和组里算法大佬的定义有些分歧，不过谁让这是个人文章呢：）就按个人来。

七、填槽意义

结合上文，咱们须要了解到，填槽的意义有两个：做条件分支多轮对话、做信息补全用户意图。换言之，填槽不只是补全用户意图的方式，并且前序槽位的填写还会起到指导后续信息补全走向的做用。

八、准入条件

上文咱们讲到，完整的多轮对话过程一般会以树的形式存在，树中包含多个节点，表明处理这件事情的一个步骤。

而每一个节点，都应当有其特别的准入条件。树的根节点每每须要限制 NLU 模块的输出，也即明确什么样的用户意图将会由该棵多轮对话树来处理；树的中间及叶子节点每每须要根据前序槽组的填槽结果以及其余背景信息进行条件限制。（若是将全部信息，好比 NLU 模块输出，或是其余背景信息都看作前序槽组的填写结果，那就能获得统一的槽组-条件-槽组-条件······形式，槽组用于获取信息，条件用于信息限制）

我尝试从两个角度来描述一套完备的准入条件体系。

一个是多条件的组织形式，准入条件在逻辑上应该支持条件间的与或非，百度的 UNIT 平台提供了一种相对成熟的组织形式，将准入条件总体划分为条件和条件组，条件包含在条件组中，组内条件间是且关系，条件组之间是或关系（固然这里的且与或能够根据自身业务状况对调），条件自己支持非关系。

一个是单条件的限制能力，准入条件应当同时支持对前序槽组填写值、填写方式、填写状态进行限制。也即须要有针对值的条件、针对类型的条件和针对状态的条件。简单的讲，状态就是『填了吗』，类型就是『谁填的』，值就是『填了什么』。

不一样业务场景下咱们会须要不一样角度的限制条件。好比，上文中提到填槽的意义包含两种：做条件分支多轮对话、做信息补全用户意图，若是仅仅做信息，那咱们一般就只关心『填了吗』，只要填写完成就进行后续步骤，并不关系『谁填的』以及『填了什么』；可是若是槽组内的填入值会影响后续多轮对话走向，那咱们就倾向于经过槽组的填入方式或填入值来做多轮对话的分支。

3、答案系统、话题切换和状态切换

1）答案系统

先明确一个观点，多轮对话树的节点属于对话节点而不是答案节点，同一份答案可能会出如今多个对话节点中。

答案系统和多轮过程应当是解耦的，答案系统中的每份答案都应当设置好本身的触发条件。举个例子，若存在 ABC 三个槽，A=A一、B=B三、C=C1 提供答案一，A=A二、B=B一、C=C2 或 A=A三、B=B二、C=C1 提供答案二。

另外，答案的种类也不该仅局限于文本，富文本、接口、话题切换，均可以视为合理的答案形式。

2）话题切换

话题切换指用户与用户的对话从一个多轮过程切换至另外一个多轮过程，话题切换有主动切换和被动切换之分。

上文提到的做为答案的话题切换，就能够理解为主动的话题切换。

被动的话题切换是指，系统发现没法从用户的问句中抽取信息以继续当前的多轮对话，只好将其做为一条全新的问句从新进行解析和话题识别。

话题切换，尤为是主动的话题切换会涉及到一个新问题：槽继承。举个例子——

我：『我明天要坐高铁从杭州到北京』

我：『算了，仍是坐飞机吧』

这种状况下，机器人不该当重复询问『出发地』、『出发时间』和『目的地』。

除了槽继承，还有一个与之相对的问题叫作槽记忆，这一般适用在被动式的话题切换中。因为解析失误，或者其余缘由，使得用户跳出了原话题，当用户在必定时间内从新回到原话题时，不该让用户重复进行填槽，该技术已被用于阿里小蜜，不过他们彷佛称之为『多轮状态记忆』。

举个例子——

我：帮我订张从杭州到北京的机票。

VPA：请问您但愿哪天出发呢？

我：明天杭州下雨吗？

VPA：明天杭州有雷阵雨。

我：后天呢？

VPA：后天杭州天气晴。

我：机票订后天的。

VPA：好的，已帮你预约后天从杭州到北京的机票。

三、状态切换

咱们还须要思考这样一个问题，既然话题能够切换，也即一个多轮过程能够切换到另外一个多轮过程，那多轮过程当中的对话状态是否能够切换？

我举两个例子——

第一个：

我：帮我订张机票，从杭州出发。

VPA：请问你想去哪呢？

我：（发现明天杭州有雷阵雨）换出发地。

VPA：请问你想从哪出发呢？

我：上海。

多轮对话应当容许回到前序节点。

第二个：

我：我想买个杯子。

VPA：如下是为您推荐的杯子。（展现结果一）

我：换一换。

VPA：如下是为您推荐的杯子。（展现结果二）

多轮对话应当容许重复进入同一节点。

结语

就先这么多吧：）

注，饭团“AI产品经理大本营” ，是黄钊hanniman创建的、行业内第一个“AI产品经理成长交流社区”，经过天天干货分享、每个月线下交流、每季职位内推等方式，帮助你们完成“AI产品经理成长的实操路径”。

---------------------

做者：黄钊hanniman，图灵机器人-人才战略官，前腾讯产品经理，5年AI实战经验，8年互联网背景，微信公众号/知乎/在行ID“hanniman”，饭团“AI产品经理大本营”，分享人工智能相关原创干货，200页PPT《人工智能产品经理的新起点》被业内普遍好评，下载量1万+。

检索式chatbot：word2vec/GloVe/fasttext

1. 扫盲

2. 检索式模型的套路

深度学习模型复现难？看看这篇句子对模型的复现论文

同媒体快讯

相关快讯

NLP︱高级词向量表达（一）——GloVe（理论、相关测评结果、R&python实现、相关应用）

高级词向量三部曲：

1、理论简述

一、word2vec

二、GloVe

2、测评

一、词向量测评方法

二、测评结果

三、利用词向量解决歧义问题

3、Glove实现&R&python

一、Glove训练参数

二、用R&python实现

4、相关应用

一、glove+LSTM：命名实体识别

二、PAPER：词向量的擦除进行情感分类、错误稽查

NLP︱高级词向量表达（二）——FastText（简述、学习笔记）

高级词向量三部曲：

如何在python 很是简单训练FastText，可见笔者博客：

1、FastText架构

一、fastText 架构原理

..二、改善运算效率——softmax层级

2、FastText的词向量表征

一、FastText的N-gram特征

三、FastText词向量与word2vec对比

3、FastText实现

.延伸一：重磅：facebook公开了90种语言的Pre-trained word vectors

NLP︱高级词向量表达（三）——WordRank（简述）

一、wordRank，与 word2vec、fastText三者对比

二、wordRank，与 word2vec、GloVe三者对比

高级词向量三部曲：

应用

方法

传统方法

分类流程

文本预处理

文本表示

特征权重计算

特征选择

深度学习方法

3. 论文串烧

必需要提的：Multi-view model

一次大大的进化：SMN model

utterance也要深度encoding！DUA model

state-of-the-art：DAM model

总结

填槽与多轮对话 | AI产品经理须要了解的AI技术概念

序言

1、多轮对话

2、槽

3、答案系统、话题切换和状态切换

结语

.
.
二、改善运算效率——softmax层级

.
延伸一：重磅：facebook公开了90种语言的Pre-trained word vectors