speaker vector

ivector ivector包含了说话者和声道的信息,每一帧提取出若干维特征,然后做长度归一化,再通过LDA/PLDA消除声道信息,只保留说话者信息。 关于LDA和PLDA的算法描述 LDA:线性分类器–基本原理是将带上标签的数据(点),通过投影的方法,投影到维度更低的空间中,使得投影后的点,会形成按类别区分,一簇一簇的情况,相同类别的点,将会在投影后的空间中更接近。 xvector 从stag
相关文章
相关标签/搜索