(早前的一个智能聊天机器人设计,实际使用中已经改了不少了。)并发
简述
主要分三块:框架
- SuperRobot 框架主体。
- 天然语言理解系统。
- 词向量Trainer。
SuperRobot
- AliceBot负责闲聊,采用AIML Engine,属于rulebased。
- 闲聊语句经过后台输入到DB。
- ServiceBot负责业务QA,Matcher负责匹配工做。
- 自定义QA对经过后台输入到DB。
- AbilityBot负责与第三方系统交互,经过REST请求天然语言理解系统返回意图及实体。
- 后台能定义交互的服务接口。
- 用Java开发。
天然语言理解系统
- 主要负责的工做时意图预测和实体识别。
- 须要标注业务数据样本的实体和意图。
- 实体提取器经过序列标注训练模型并实现实体提取。
- 意图分类器经过SVM训练模型并实现意图预测。
- 麻省理工NLP工具MITIE。
- 用Python、C++ 开发。
词向量Trainer
- 主要负责词向量训练。
- 普通语料包括维基百科百度百科。
- 业务语料包括业务系统数据。
- 用DLib机器学习库。
- 用C++开发。
- 训练的模型供前面使用。
-------------推荐阅读------------机器学习
个人2017文章汇总——机器学习篇分布式
个人2017文章汇总——Java及中间件工具
个人2017文章汇总——深度学习篇学习
个人2017文章汇总——JDK源码篇.net
个人2017文章汇总——天然语言处理篇设计
个人2017文章汇总——Java并发篇cdn
------------------广告时间----------------中间件
公众号的菜单已分为“分布式”、“机器学习”、“深度学习”、“NLP”、“Java深度”、“Java并发核心”、“JDK源码”、“Tomcat内核”等,可能有一款适合你的胃口。
鄙人的新书《Tomcat内核设计剖析》已经在京东销售了,有须要的朋友能够购买。感谢各位朋友。
为何写《Tomcat内核设计剖析》
欢迎关注: