百度大脑UNIT3.0详解之语音语义一体化方案

在电话客服场景里,用户和机器人交流的过程当中,常常会出现沉默、打断机器人、噪声等状况,机器人在应对这些异常状况的时候,须要语音和语义理解技术进行处理,才能实现用户和机器人的流畅交谈。而这些能力的获取与应用,也是企业智能对话项目落地过程当中须要解决的难题之一。html

为此,UNIT带来了全新的语音语义一体化解决方案,帮助企业解决语音交互过程当中的难题。编程

【电话客服场景下语音语义一体化解决方案】网络

image.png

语音语义一体化是针对电话客服对话场景的技术方案,可用于呼叫中心智能客服等业务。整个方案包含如下内容:框架

(1)下降集成开发成本学习

提供语音识别、语义理解、对话流程控制、知识库、语音合成的打通方案,全双工对话能力,一体化的部署方案,省去开发者对各环节自行调用、拼装的学习成本以及二次开发成本。spa

(2)标准协议快速接入server

提供基于unimrcp框架开发的mrcpserver服务接入包,经过标准协议适配不一样呼叫中心设备(主流的freeswitch、avaya、及基于mrcp标准协议自主研发的呼叫中心设备)。htm

(3)场景定制服务提高效果blog

方案中自带基于百度大脑呼叫中心下的通用ASR、语义纠错,打断策略,TTS模型,也能够基于开发者的业务场景,提供模型定制训练服务,定向提高业务准确率。排序

(4)极少许开发,轻松实现对话流程

提供Taskflow配置管理能力,开发者可在梳理业务流程后,经过少许代码快速配置对应的对话流程,后续可直接零代码在UNIT平台上进行拖拽式配置。

image.png

【语音语义一体化方案解读】

(1)语音识别ASR

采用领先的百度语音技术,实时将音频流转识别出文本,并自动识别断句。

(2)全双工对话能力

创建通用机制,组织多模块协同工做,实现双通道数据(文本、事件信号)实时分发及处理。

(3)纠错

根据场景相关词汇生成纠错候选,利用GBDT模型对获选打分排序,最后经过beam search解码出最优纠错结果。

(4)打断

采用分类模型实现,判断是否知足打断条件,并下发打断信号,可支持用户自定义语料的模型训练。

(5)静默及反问

在设定时间内用户未回复状况下,机器人可自动反问。可支持用户对时间条件、机器人反问话术进行配置。

(6)挂机、转人工

定义标准事件信号:挂机、转人工。用户可经过配置、或简单二次开发完成判断条件的设定。

(7)对话理解

基于UNIT强大的语义理解能力,从实时文本中,解析用户意图。

(8)对话逻辑引擎

以可编程的方式构业务建对话逻辑。

(9)语音合成TTS

基于深度神经网络技术,提供高度拟人,流畅天然的语音合成服务,便于应用、设备开口说话,更具个性。

【如何获取语音语义一体化能力】

开发者能够进入UNIT官网——解决方案——语音语义一体化方案页面,了解技术详情并体验真实对话样例。https://ai.baidu.com/unit/v2/static/voice

一、方案了解

image.png

二、真实对话样例的体验

image.png

若是您的产品或项目须要使用语音语义一体化方案,请在上述页面下方点击“联系咱们”。

点击阅读上一篇相关文章:

百度大脑UNIT3.0解读之对话式文档问答——上传文档获取对话能力

相关文章
相关标签/搜索