JavaShuo
栏目
标签
Uncovering Latent Style Factors for Expressive Speech Synthesis
时间 2021-07-12
原文
原文链接
最近拜读王宇轩的旧作,希望能顺着作者的思路窥得一点语音合成研究的方向。 这篇文章应该是宇轩大佬刚进谷歌发表的,2017年。应该是tacotron发表之后,GST的想法雏形,因此文章只放在axriv上边。 abstract 本文旨在控制语音合成的韵律,在tacotron的基础上加"style token",从而不需要注释的数据,可以直接通过data-driven的方式,学到各种韵律的变化。变长的句子
>>阅读原文<<
相关文章
1.
[ICCV2019] Unsupervised Robust Disentangling of Latent Characteristics for Image Synthesis
2.
Hierarchical Generative Modeling for Controllable Speech Synthesis笔记
3.
Tacotron: Towards End-to-End Speech Synthesis
4.
style-GAN:A Style-Based Generator Architecture for Generative Adversarial Networks. (一)
5.
[TMI2018-03]Multimodal MR Synthesis via Modality-Invariant Latent Representation
6.
HTML5 之音频合成(Speech Synthesis)
7.
[Style Transfer]——Blood Vessel Geometry Synthesis using Generative Adversarial Networks
8.
【文献解读 情感合成】Expressive Speech Driven Talking Avatar Synthesis with DBLSTM using 有限的情感双峰数据
9.
Voice Conversion by Cascading Automatic Speech Recognition and Text-to-Speech Synthesis with Prosody
10.
HTML5语音合成Speech Synthesis API简介
更多相关文章...
•
ASP.NET Style 控件
-
ASP.NET 教程
•
ASP.NET Style 属性
-
ASP.NET 教程
•
PHP开发工具
•
C# 中 foreach 遍历的用法
相关标签/搜索
speech
synthesis
expressive
uncovering
latent
factors
style
loader&style
4Large-Style
style&theme
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
深度学习硬件架构简述
2.
重温矩阵(V) 主成份分析
3.
国庆佳节第四天,谈谈我月收入增加 4K 的故事
4.
一起学nRF51xx 23 - s130蓝牙API介绍
5.
2018最为紧缺的十大岗位,技术岗占80%
6.
第一次hibernate
7.
SSM项目后期添加数据权限设计
8.
人机交互期末复习
9.
现在无法开始异步操作。异步操作只能在异步处理程序或模块中开始,或在页生存期中的特定事件过程中开始...
10.
微信小程序开发常用元素总结1-1
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
[ICCV2019] Unsupervised Robust Disentangling of Latent Characteristics for Image Synthesis
2.
Hierarchical Generative Modeling for Controllable Speech Synthesis笔记
3.
Tacotron: Towards End-to-End Speech Synthesis
4.
style-GAN:A Style-Based Generator Architecture for Generative Adversarial Networks. (一)
5.
[TMI2018-03]Multimodal MR Synthesis via Modality-Invariant Latent Representation
6.
HTML5 之音频合成(Speech Synthesis)
7.
[Style Transfer]——Blood Vessel Geometry Synthesis using Generative Adversarial Networks
8.
【文献解读 情感合成】Expressive Speech Driven Talking Avatar Synthesis with DBLSTM using 有限的情感双峰数据
9.
Voice Conversion by Cascading Automatic Speech Recognition and Text-to-Speech Synthesis with Prosody
10.
HTML5语音合成Speech Synthesis API简介
>>更多相关文章<<