Python实现语音识别和语音合成

时间 2020-12-31

原文原文链接

声音的本质是震动，震动的本质是位移关于时间的函数，波形文件(.wav)中记录了不同采样时刻的位移。通过傅里叶变换，可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加，通过频率谱线的特殊分布，建立音频内容和文本的对应关系，以此作为模型训练的基础。案例：画出语音信号的波形和频率分布，（freq.wav数据地址） # -*- encoding:utf-8 -*- import numpy a

>>阅读原文<<