开放领域的聊天机器人

时间 2019-12-06

标签开放领域聊天机器人繁體版

原文原文链接

本文由【FMI飞马网】原创，原文连接：开放领域的聊天机器人php

鉴于人工智能如今火的一塌糊涂，飞马网邀请了北京大学博士陈晨，在线为你们研究关于“开放领域的聊天机器人”。网络

陈晨框架

陈晨，博士，北京大学助理研究员。曾参与Google、百度、腾讯等互联网公司研发项目并负责落地实践，主要研究领域为天然语言处理、机器学习、深度学习，已发表多篇论文。机器学习

聊天机器人的发展学习

一开始，陈老师就为咱们先介绍了聊天机器人的发展历程。源于图灵在1950年发表的文章，文章提出了图灵测试，是指将测试者与被测试者分分开，测试者经过一些装置对被测试者进行提问，若是最后有30%的测试者没法分辨出对面的人仍是机器，那么这台机器就能够经过测试，能够被认为具备人类智能。其中30%是图灵对2000年的机器思考能力的预测，但到目前为止，许多技术仍是落后的。同时，也有人认为图灵测试是人工智能的终极目标。测试

近年来，随着深度学习技术的发展，围绕着聊天机器人的商业应用也是层出不穷，好比苹果的Siri、微软的Cnrtana和小冰、Google Now、百度的度秘、亚马逊的蓝牙音箱等，不论是大企业仍是小公司，都将聊天机器人当作是下一代人机交互的服务渠道。搜索引擎

陈老师表示，聊天机器人不仅仅是提供了一种服务渠道，它还改变了服务自己，可以经过历史数据训练语言模型来取代人的做用。总得来讲，聊天机器人技术是对信息的组织和处理能力在搜索引擎的基础上又往前迈了一大步。编码

对聊天机器人的系统进行总结能够看出他们的系统框架中分为语音识别和文字识别两大模块。人工智能

语音识别负责接收用户的语音输入，而后将语音转换成文字形式，交给天然语言理解模块。天然语言理解模块在理解了用户输入的语义以后，将计算出来的语义表达式输入到对话管理模块中。对话管理模块负责协调各个模块的调用和维护，并选择合适是回复方式，而后交给自认语言生成模块进行处理。天然语言生成模块生成回复的文本，并将语音输出给语音合成模块，最后将语音输出给用户。翻译

陈老师为咱们总结出了聊天机器人的发展有三代：

基于规则→基于检索→基于生成模型

聊天机器人的分类

其中聊天机器人的分类也是多种的：

按领域分类

从话题层面进行区分，在开放领域下，用户能够和机器人聊任何话题，在专业领域下，只能聊机器人设定的主题。

按场景分类

俺场景分为多轮对话和单轮对话。多轮对话是用户带着特定目的而来，但愿获得知足特定限制条件的信息或服务。而单轮对话当前大量研究都是面向短对话的，如微软的小冰。

按技术路线分类

能够分为检索式对话聊天系统、生成式对话聊天系统、检索和生成相结合的方法。

检索式对话聊天系统:在已有的对话语料库中经过排序学习和匹配技术找到适合当前输入的最佳回复。

生成式对话聊天系统:经过一种相似机器翻译中经常使用的编码—解码的过程去逐字逐句地生成一个回复。