这次主要是调研了如下五家智能语义平台:git
云小蜜是一款面向开发者的会话机器人,支持在不一样的消息端上实现基于天然语言处理(NLP)的智能会话。包含如下经常使用领域:算法
- 公司采购
- 办公软件系统
- 办事指南
- 报销政策
- 职业发展
- 发票知识
- 基础行政
- 公司设施
百度的DuerOS并不只仅只是提供简单的机器人,而更像是一个操做系统,提供了软件和硬件的各类接口开发。主要有三大类:json
- 自定义技能,提供了一个平台能够本身定义技能,自定义意图和词典,对用户的输入进行意图识别,而后调用意图对应的服务,实现对话式技能。好比输入语言“帮我查查附近美食”,对应意图为“查找美食”,对应的服务接口是“www.xxx.xxx/search” ,则查到结果后返回给用户。
- 智能家居技能,这个技能主要是面对智能设备厂商的技能,能够很方便对接智能家居。将用户说的话或者文本输入转到对应操做上。
- 内容播报技能,主要为内容生产者定制,好比将须要播报的信息文本上传,而后用户就能够点播文本新闻或语音新闻。
小微客户机器人适用场景:用户导入业务领域知识库信息,创建机器人知识信息基础。api
- 家庭场景,家庭内带屏幕设备接入实现对话交互。
- 车载场景,语音与汽车而结合,达到控制导航、音乐播放等语言交互。
- 运动场景,语音唤醒耳机及APP,实现互动。
- 出租车领域,出租车预约之类的意图。
- 地点领域,包括了各类地点相关意图。
- 天气领域,包括天气报告和预测意图。
- 提醒领域,包括提醒功能的建立、修改和查询意图。
- 日程领域,包括日程主题相关的规划管理意图。
- 智能家居领域,提供控制灯光、家电等操做意图。
- 笔记领域,提供笔记建立、查询和修改等操做意图。
- 网页导航领域,提供网页导航相关的功能意图。
- 翻译领域,提供翻译语言相关的意图。
- 设备控制领域,包括控制设备的意图。
- 通信领域,提供与电话、电子邮件等相关的意图。
- 音乐领域,提供与音乐播放相关的意图。
- 餐厅领域,提供餐厅预约意图。
- 注册阿里云帐号并登录。
- 建立机器人并配置机器人基本信息。
- 选择须要内置的领域知识,其中包括公司采购、办公软件系统、办事指南、报销政策、基础行政、职业发展、发票知识等等。
- 管理知识库,新增词条。
- 添加词条关联问题,当用户输入的问题匹配到词条时会展现关联的问题。
- 自定义意图,而且输入该意图用户可能的多种问法。
- 标注实体,对用户问法语句中相关的实体进行标注。
- 配置用户回复是否以文本回复,仍是配置到咱们本身的服务接口上处理后再返回给用户。
- 上线发布。
- 注册百度帐户,而后登录。
- 到后台建立本身的意图,其中包括了意图名、常见表达语句(及哪些语句对应到该意图)、表达语句的槽位、技能回复(这里包括自定义回复和服务配置知足两种类别,自定义回复便是本身将文本答案填进去,而服务配置知足则是duer会将意图识别后的数据转发到咱们的服务器接口上,咱们再本身处理)。另外,还能够定义多轮对话,但每轮对话都要咱们本身设计好。
- 建立本身的词典,有不少内置的词典能够用,包括国家、中国城市、中国省份、区/县/郡、村庄/乡镇、颜色、动物、国外城市、景点、节日、电影、音乐、名人、植物、电视连续剧、综艺节目、公交、地铁、成语、百家姓、品牌等等。
- 开始训练,DuerOS会帮咱们生成不少不一样的语句表达,好比咱们定义的是“介绍下电信套餐”,它会生成几十条相似的问法,“说明下电信套餐”、“简介下电信套餐”等之类的,但其中标注工做也仍是得咱们本身作,就是要给这几十条生成的相似问题的语句进行标注。
- 配置服务接口信息。
- 测试,发布。
- 注册腾讯云并登录。
- 申请小微机器人。
- 建立机器人。
- 上传知识库。
- 配置服务接口。
- 建立意图,同时配置槽位。
- 训练。
- 上线。
- 微软帐号登录。
- 建立一个app,其中会有culture选择,它包含了不少国家能够选择,根据不一样国家文化理解语言文字。
- 能够选择本身须要的领域,领域包含了不少意图,每一个意图包含了不少提问。
- 建立意图,根据本身业务须要本身定义意图。
- 建立实体,实体能够用来对问题进行序列标注。
- 一条条添加业务问题,便是常见的业务咨询语句。
- 将每一个业务问题咨询语句中相关的实体标出来,后续训练后用于实体提取。
- 开始训练模型。
- 完成训练,开始使用模型预测意图及实体提取。
- 发布模型,使用提供的url接口进行访问。
https://chatbot.cn-shanghai.aliyuncs.com/
?Format=xml
&Version=2017-10-11
&Signature=Pc5WB8gokVn0xfeu%2FZV%2BiNM1dgI%3D
&SignatureMethod=HMAC-SHA1
&SignatureNonce=15215528852396
&SignatureVersion=1.0
&AccessKeyId=key-test
&Timestamp=2017-10-11T12:00:00Z
复制代码
<?xml version="1.0" encoding="UTF-8"?>
<!—结果的根结点-->
<接口名称+Response>
<!—返回请求标签-->
<RequestId>4C467B38-3910-447D-87BC-AC049166F216</RequestId>
<!—返回结果数据-->
</接口名称+Response>
复制代码
{
"event": {
"header": {
"namespace": "ai.dueros.device_interface.text_input",
"name": "TextInput",
"messageId": "f894055e-a81e-4b4d-a97e-72c4d3a9ada4",
"dialogRequestId": "720cc607-cff9-411e-83f4-03daca331ef3"
},
"payload": {
"query": "介绍下电信套餐"
}
},
"clientContext": [
{
"header": {
"namespace": "ai.dueros.device_interface.location",
"name": "GpsState"
},
"payload": {
"longitude": null,
"latitude": null,
"geoCoordinateSystem": "BD09LL"
}
}
],
"debug": {
"bot": {
"id": "ec773bfc-f907-bfae-160b-b6ec2250fd5d"
},
"simulator": true
}
}
复制代码
{
"directive": {
"header": {
"namespace": "ai.dueros.device_interface.screen",
"name": "RenderCard",
"dialogRequestId": "720cc607-cff9-411e-83f4-03daca331ef3",
"messageId": "NWE3MTNmMmU1ZWJiZTE0NTE="
},
"payload": {
"type": "TextCard",
"content": "请问套餐编号是什么?",
"token": "eyJib3RfaWQiOiJ1cyIsInJlc3VsdF90b2tlbiI6IjBhYTU3MGM0LWNhODQtNGEzYS05NmM2LTBkOTAwM2Y3YjcyNSIsImJvdF90b2tlbiI6Im51bGwifQ=="
}
}
}
复制代码
https://yun.tim.qq.com/v3/prophet/$command?appid=$appid&sdkappid=$sdkappid&identifier=$identifier&usersig=$usersig&random=999999&contenttype=json
复制代码
{
"botid": "third party account",
"auth": "",
"from_user_name": "小明",
"question": "发送消息失败",
"max_answer_num": 10
}
复制代码
只提供url接口,全部应用本身经过http协议进行访问。好比下面的访问,系统会返回一串json格式报文,其中包括各类意图的可能性得分,还有提取到的实体。浏览器
westus.api.cognitive.microsoft.com/luis/v2.0/a…bash
{
"query": "有没有流量包月套餐",
"topScoringIntent": {
"intent": "电信业务咨询",
"score": 0.9712404
},
"intents": [
{
"intent": "电信业务咨询",
"score": 0.9712404
},
{
"intent": "None",
"score": 0.2136391
},
{
"intent": "查找餐馆",
"score": 0.0577361658
}
],
"entities": [
{
"entity": "包月套餐",
"type": "套餐",
"startIndex": 5,
"endIndex": 8,
"score": 0.832137644
}
]
}
复制代码
专一于人工智能、读书与感想、聊聊数学、计算机科学、分布式、机器学习、深度学习、天然语言处理、算法与数据结构、Java深度、Tomcat内核等。服务器