关于客服系统中的机器人算法
客服系统的兴起是基于知足下降公司人力成本、维护精力的需求,一套客服系统的产品设计,上次有分享过史上最详细的客服系统产品落地|后台产品经理的工做实例,有那么苦吗?,但除了工单管理、客户管理、以及客服系统的BI,其实最为困难的就是如何提高客服系统的使用效率。
微信
就客服系统的使用效率,其根本就是是否可以为企业下降人工服务的次数、仍共服务的时间占比,甚至是提高公司的营业业绩。在这里面,我落地的客服系统其占比最终的仍是机器人回答。app
【机器人问答的产品设计】学习
但机器人回答的发展期间,机器人的回答方式也在现在也是基于关键词匹配与大数据结合的状况下发展的。测试
【APP端机器人客服】大数据
【WEB端客服】网站
产品落地中,调研到目前国内的方法在中文分词中,如今有三大分词算法ui
第一类叫作基于字符串匹配的分词方法
设计
第二类基于理解的分词方法3d
第三类基于统计的分词方法
相对于早起的纯关键字匹配,如今国内的机器人也是基于NLP(天然语言处理技术也逐渐在兴起),做为PM的咱们,到底要如何去落地机器人问答系统?我谈谈个人案例分享
01知识库的创建
若是说从0-1作客服系统,那么机器人的模块从一开始规划中最为重要的就是创建知识库,这个知识库的重要性在于之后的模型创建。
那么问题来了,什么是模型?
【对话模型】
平常生活中,咱们所知道的模型就至关因而一个模具,一个模具的能够做为一点,其制做更多产品,把模型作的越好、越精确,在量产中就会获得更准确的结果。
更加精准、更加快速
那么对话模型,就是咱们这里提的一个模型。在不一样行业中,咱们能够知道起用户发文的内容范围、回答的范围是不一样的。
那么如何训练模型,简单来讲就是经过对话找到问题的答案,答案的问题
【问题与答案的训练】
【答案与问题的训练】
这里提一个关键词:语料
预料你能够理解问一些词库,不过这个词库不一样的是他会包含更多测试词语、句子、符号等数据,而词库则是咱们知识库中最为关键的一个匹配词库。
既然要考虑模型和语料,咱们首先要考虑公司的业务是什么?这就是所谓的特定领域,再到全局领域
目前这些语料都有网上的一些公开的包,PM能够去下载了解下是否符合公司的业务。经过这些语料包,能够去知道语气词、标点符号、违规敏感等
这里从特意领域的语料,简单举个列子在金融证券行业,最为关键的语料就是:公司产品名称、股票名称、公司名称、经常使用服务名称
这些都算语料里面的词库,在一个公司创建知识库中,我是按下图进行分类组合
既然上面的逻辑关系清楚了,咱们能够清楚知识库是起着机器人回答的一个重要部分
【网易7鱼】
从上面的图能够看到,其知识库时候为了分类管理,提供了一个分类管理的模块,而且将问题与知识库进行关联。
【知识点与FAQ】
将问题匹配进入相应的知识点,机器人也须要知道谐音、或包含问题之外的其余内容,如何去掉无效内容,匹配问题答案。
【类似词库】
创建类似词库的意义就是为了方便机器人把类似处看做同义词进行理解,把问题进行匹配。
在知识库中添加问题与答案,咱们这里落地首先要考虑问题与答案的对应关系。
也就是在对话模型中,一个问题是否会对应2个答案,一个答案是否会对应2个以上的问题?
【知识库添加】
最好的方式是利用EXCEL文档的方式整理,将文档导入上传。这里我借鉴了一些客服系统的机器人中心文档,将他们的文档进行归类,整理了以下模版
这样的话,公司即便没有客服系统,但经过平常的文档归类,也能够快速的创建词库。
01
在产品设计中,这套系统仍是基于字符串匹配的算法。利用正相最大匹配、逆向最大匹配分、以及最小切分
那么什么是正向匹配算法?
正向最大匹配算法:从左到右将待分词文本中的几个连续字符与词表匹配,若是匹配上,则切分出一个词。
但这里有一个问题:要作到最大匹配,并非第一次匹配到就能够切分的 。咱们来举个例子:
待分词文本以下:
content[]={"产","品","经","理","从","此","站","起","来","了","。"}
词表: dict[]={"产品", "产品经理" , "今后","站起来"}
这里CONTENT[1]开始进行从左到右正向扫描,那么扫描到第一个content[1],这个时候扫描的为“产”字,扫描到第二个content[2],这个时候扫描到[产品];和dict[1]匹配上了,可是由于字数才2个字,须要为3个字,就继续这样向下扫描。
循环处理,最终将词语扫描出来。但这样扫描出来的结果可能为:产品/产品经理/从/此/站起/来,或产品/产品经理/从/此站起/来......
等结果,利用最小切词,切词的换算方式,但固然既然采用的是基于字符串匹配的分词方法,其劣势就在这里,切分为致使歧义问题。
所以咱们会把逆向最大匹配、正向最大匹配、最少分词结果进行综合匹配。最少分词就是将针对正向、逆向的问题,将双向切分的结果进行比较,选择切分词语数量较少的结果。
01
机器人在设置中,建议一开始没有词库的时候,产品经理须要考虑一些基本词库,这些词库是公司名称、公司产品、微信公众号、网站地址等
【机器人初始化】
【机器人初始化】
这样设计的理由很简单,这是公司的基本问题或回答。在这套客服系统机器人是对外或甚至之后运营盈利状况下,方便客户首先设置好本身的基本机器人资料。
除了以上的机器人基本词库之外,还有机器人寒暄词库,而且产品设计中要对每个类型的词库回答进行限制。
好比当问了3个问题,都没法匹配到机器人的答案,机器人应该以转换人工的提醒方式或回答方式,让用户去寻找人工解决办法。
【切换人工】
在当前的机器人系统中,在这个产品设计我一直定位该产品是辅助于人工客服去减小工做量,增长工做效率。机器人并不能彻底替代人工,因此时刻保持机器人与人工的切换,让用户可以得到好的解决体验。
总结
在当下科技不断发展的时代,都说是AI的时代,从之前的大数据到现在的AI时代,智能机器客服系统就是典型的一个产品。
虽然对于PM来讲,客服系统的难点在于如何去跑通公司客服业务流程,创建起一套好的服务流程。
1.分担客服工做量
2.积累客服经验,不断完善问题库
3.自定义机器人样式,模拟人工聊天。
但难点也在于如何经过人工客服去积累学习更多的知识,以及经过数据渠道得到客服以及所在客户行业的专业基础知识。
我的微信574319420
微信公众号:KEVIN改变世界的点滴