【赞】【转】CUI三部曲之语音识别——机器如何理解你的话?

在智能时代,以对话为主要交互形式的CUI会应用到越来越多的场景中。进行对话交互时,机器往往需要完成“听懂——理解——回答”的闭环。这个闭环涉及到三类技术:语音识别(ASR)、自然语言处理(NLP)以及语音合成(TTS)。 语音识别的任务是将用户所说的话从声音形式转变为文字形式,自然语言处理则是理解这些文字所要表达的意思(语义)。理解了用户的意图之后,机器同样会以语音的形式给出相应的回答,这就需要用
相关文章
相关标签/搜索