科普|自动语音识别(ASR)技术的原理及过程,语音识别接口逻辑

我们介绍了智能语音识别技术的整体过程,共分为ASR、NLP、TTS三大步。本文我们对ASR过程进行进一步解析。 ASR(自动语音识别)就是将麦克风采集到的自然声音转化为文字的过程,相当于人的耳朵+大脑(一部分)。下图是机器识别人类的语音输入(亦即ASR)博主多年操作经验发现的原理和过程: 第一步:建立声学模型。对于同一个单词或汉字,由于不同人的发音、语调、语速等各不相同,比如男人和女人的、大人和小
相关文章
相关标签/搜索