声纹识别笔记（二）ivector PLDA 以及最新模型

时间 2020-12-23

原文原文链接

GMM-UBM GMM：均值、方差、权重 UBM：共性特征 i-vector MAP说话人自适应 m：UBM的均值（已知） s：把UBM针对特定说话人调整成GMM，GMM的均值（通过特征得到） T：训练得到 w：特定说话人的ivector 一般只更新均值，不更新方差 DNN-based ivector d-vector 输入之前的30帧和之后的10帧，总共40帧Fbank作为输入，中间通过N层全连

>>阅读原文<<

1. 声纹识别PLDA模型的理解
2. 声纹识别之PLDA
3. 声纹识别学习记录
4. 【声纹识别】——综述
5. 声纹识别原理
6. kaldi中的声纹识别
7. 声学特征 ivector
8. 声纹识别知识整理
9. 声纹识别
10. 声纹识别之I-Vector
更多相关文章...
• ADO 更新记录 - ADO 教程
• ASP.NET MVC - 模型 - ASP.NET 教程
• Tomcat学习笔记（史上最全tomcat学习笔记）
• Kotlin学习（二）基本类型