语音合成领域的首个完全端到端模型，百度提出并行音频波形生成模型ClariNet...

时间 2021-01-05

原文原文链接

语音合成（Text-to-Speech，TTS）是将自然语言文本转换成语音音频输出的技术，在 AI 时代的人机交互中扮演至关重要的角色。百度硅谷人工智能实验室最近提出了一种全新的基于 WaveNet 的并行音频波形（raw audio waveform）生成模型ClariNet，合成速度提升了数千倍，可以达到实时的十倍以上。此外，这也是语音合成领域第一个真正的端到端模型：单个神经网络，直接从文本到

>>阅读原文<<

1. 百度推出完全端到端的并行音频波形生成模型，比WaveNet快千倍 | 论文
2. 百度语音合成模型Deep Voice3
3. WEB端百度语音合成Demo
4. WaveNet:一种语音合成的模型
5. 谷歌tacotron端到端的文本转语音合成模型实践
6. Python百度语音合成
7. 百度语音合成
8. c# 百度语音合成
9. C# 百度语音合成
10. 百度语音合成api
更多相关文章...
• ASP.NET MVC - 模型 - ASP.NET 教程
• Eclipse 生成jar包 - Eclipse 教程
• 委托模式
• Kotlin学习（二）基本类型