speaker vector

时间 2021-01-02

原文原文链接

ivector ivector包含了说话者和声道的信息，每一帧提取出若干维特征，然后做长度归一化，再通过LDA/PLDA消除声道信息，只保留说话者信息。关于LDA和PLDA的算法描述 LDA：线性分类器–基本原理是将带上标签的数据（点），通过投影的方法，投影到维度更低的空间中，使得投影后的点，会形成按类别区分，一簇一簇的情况，相同类别的点，将会在投影后的空间中更接近。 xvector 从stag