1.分享者:赵俊良node
毛豆网客服总监,北京交通大学硕士,曾任北京联合大学信息学院讲师,拥有十余年嵌入式系统研发经历和智能仪器测控领域的创业经历正则表达式
Bot Friday - 沙龙第5场分享 实现支持微信小程序的聊天机器人npm
2019-08-16 于北京微软,zhaoicjson
2.wechaty的小程序实现小程序
因为项目的需求,接入了wechaty,感受很好用。后来发现,发送小程序部分还不能实现,在大神们的鼓励下,历经艰辛,修改为了能够成功的发送小程序。后来在李卓桓的建议下,咱们提交了PR,第一次给开源项目提交PR,本觉得很简单,实际中也碰到了一些问题,好在都解决了。微信小程序
(1)开发环境的创建api
新手作开发时,在这一步可能会浪费大量的时间。我本人就是这样,首次创建本地开发环境时,花了一天的时间,其实这个时间彻底能够节省下来,这里对wechaty-puppet-padpro本地开发环境的配置,作个简要说明,但愿后续的开发者能更加容易的用wechaty作开发。微信
这里涉及到wechaty,wechaty-puppet,wechaty-puppet-padpro三个库,测试使用官方的wechaty-getting-started,各类关联错综复杂,这里须要感谢一下苏畅,在他的帮助下,我也花费了一天时间才跑通,可是在捅破窗户纸以后,发现其实也很简单app
各个库之间的关联关系以下图学习
1)wechaty,wechaty-puppet,wechaty-puppet-padpro这三个库在本地都须要
npm i && npm run dist && npm link
改动代码后须要运行 npm run dist
npm i以后,须要运行npm link
2)wechaty连接上本地库
npm link wechaty-puppet
npm link wechaty-puppet-padpro
复制代码
3)wechaty-getting-started连接上本地wechaty
npm link wechaty
复制代码
即搭建好了开发环境,使用下面的命令便可开发测试,其中WECHATY_PUPPET_PADPRO_TOKEN须要得到有效的token
ECHATY_PUPPET=wechaty-puppet-padpro WECHATY_PUPPET_PADPRO_TOKEN=puppet_padpro_xxxx node examples/some-example.js
复制代码
(2)开发测试
小程序的payload接口的定义以下
export interface MiniProgramPayload {
appid? : string, // optional, appid, get from wechat (mp.weixin.qq.com)
description? : string, // optional, mini program title
pagepath? : string, // optional, mini program page path
thumbnailurl? : string, // optional, default picture, convert to thumbnail
title? : string, // optional, mini program title
username? : string, // original ID, get from wechat (mp.weixin.qq.com)
}
复制代码
其中username和appid能够在小程序的后台得到,有这两项,就能够发送出小程序了,可是样子是这样的
thumbnailurl是预留的,目前还不起做用,计划将来经过这个url传送一个图片,用于小程序的封面,其他各项对应关系以下图
到这一步,因为没法自动生成cdnthumbnail相关的信息,小程序还不能显示出图片,为了知足业务的须要,咱们经过分析小程序xml,提取出了相关数据,硬编码在padpro里。这样终于能够发送出一个相对完整的小程序了,缺点是图片是固定的。将来若是有高手熟悉小程序cdn这部分,能够继续完善wechaty-puppet-padpro。
关于wechaty-puppet-padpro中小程序的详细部分,能够参考如何用PadPro实现发送微信小程序
3.用正则表达式实现聊天机器人
咱们目前的业务场景,仍是比较简单的,程序里经过正则表达式就能比较好的知足咱们的需求
(1)对于时间的识别 毛豆少儿课堂小程序,是想经过识别出时间,设置课程提醒,因此对于时间的识别就很关键,通过测试对比,NLP最终选用了微软的@microsoft/recognizers-text-suite,微软的NLP,根据输入的文本,返回一个复杂的json值,在这个返回值中,找到字段中的须要时间。寻找优先级路径以下图。例如,在datetime中找到有效时间,就返回,不然在time中查找,如此一级一级,若是全部字段都没有有效时间,返回空,不创建课程提醒。
(2)一些识别歧义的处理
在文本的识别中,有一些特殊须要处理的地方
特殊符号的处理
在微信文本中,常常会遇到一些表情符号,有可能会影响到识别,经过正则表达式,能够去除
var msgText = originalText.replace(/<[^>]*>?/gm, '')
复制代码
还有一些文本信息,若是以空格开头,也会影响识别,下面是去除开头空格的正则表达式
msgText = msgText.replace(/(^\s*)/g, '')
复制代码
时间歧义
在周日晚上6:30这种语言环境下,晚上6:30没有歧义,可是周日,能够看到nlp解析出两个日期,上周日和本周日,通常本周日才是咱们要表达的,因此此处选用第二个结果
在6月9日10点这种语言环境下,会产生两个歧义四种结果,今年或明年的6月9日,上午或下午10点,因此能够看到识别的结果是四个,第二个结果正好巧合是咱们须要的。
而换成6月9日22点这种语言描述,时间的歧义没有了,会返回两个年的结果,今年或明年的6月9日,按照以前惯例,仍然选用第二个识别结果,就会产生偏差,明年的6月9日,明显不是须要的结果。
九号楼的歧义
在实际测试中,在时间前会出现某某号楼这样的词语,例以下面的实例,出现九号楼,会致使识别成日期9日
为了不相似问题,经过正则表达式,在号楼前加入#,能够较好的解决这类问题。
var msgText2 = msgText.replace(/号楼/g, '#号楼')
复制代码
2-6点歧义
在时间识别中,还有相似2-6点这种描述,NLP会识别出6点,而咱们想要的倒是开始时间2点
经过正则表达式,将 (数字)-(数字)点 这种描述,改写成 (数字)点-(数字)点,就能较好的识别出开始时间
var msgText2 = msgText2.replace(/(\d+)\-(\d+)点/g, '$1点-$2点')
复制代码
小助手新加好友的处理
因为和客户沟通的入口,都放在微信小助手,而小助手新加好友后,微信会有自动回复:我经过了您的朋友验证请求,如今咱们能够开始聊天了,其中关键词如今,会致使识别出当前时间,让小助手建立提醒,并推送给新加好友,形成很差的体验。
然而关键字如今也很重要,因此这里经过正则表达式,将如今咱们删除,防止错误的识别,同时也能保留关键词如今
var msgText2 = msgText2.replace(/如今咱们/g, '')
复制代码
(3)与现有产品的挂接
通过前面的处理后,若是正确识别出了时间,就能够根据句子中的关键词,给用户推送相应的服务。目前小助手支持会议模式,直播模式和课堂模式。
const reg = /zoom|视频会议|音频会议|演讲|群学习/g
if(msgText.match(/直播/g)){
let invite_url = '\n邀请连麦连接\nhttps://smh.maodou.io/invite/' + live_id + '/1234567890'
let admin_url = '\n\n直播间后台连接\nhttps://smh.maodou.io/admin/content/course/' + live_id
....
}
else if(msgText.match(reg)){
console.log(chalk.red('匹配到会议关键词'))
let meeting_url
if(msgText.match(/zoom|视频会议/g)){
meeting_url = '\n视频会议连接\nhttps://kaihui.maodou.io/j/683175?mode=zoom'
}
else if(msgText.match(/音频会议/g)){
meeting_url = '\n音频会议连接\nhttps://kaihui.maodou.io/j/683175?mode=audio'
}
.....
}
复制代码
实际测试效果,以下图所示
4.demo-毛豆课堂现场的快速体验
分享的最后,在现场作了一个毛豆课堂的demo,经过和小助手互动,建立了课程和小程序提醒,将小程序推送给现场嘉宾,加入小程序提醒后,会收到短信上课提醒,经过短信中的连接,用户能很快速进入课堂进行互动。
5.后续工做
目前,wechaty发送微信小程序,毛豆小助手的时间识别,还有许多须要改进的地方。咱们但愿逐步的完善,找到一个最佳的体验。
(1)完善小程序cdn图片 小程序的图片cdn地址,目前在wechaty-puppet-padpro中没法生成,若是有熟悉这部分的高手,能够接着完善
(2)挂接讯飞stt语音转文字 毛豆小助手,目前只能识别分析文本信息,计划将来能够接入讯飞语音转文字接口,让小助手具备更佳的用户体验
(3)聊天机器人训练引擎化 将代码引擎化,经过配置文件或api进行训练与更新,能让非技术人员也方便的完善机器人的训练