可视化词向量-TSNE

可视化词向量的好处是可以验证训练的词向量的效果,常采用TSNE方法可视化。 t-分布领域嵌入算法,它只用于已标注数据时才真正有意义,可以明确显示出输入的聚类状况。 主要想法是将高维分布点的距离用条件概率来表示相似性,同时低维分布的点也是这样表示。只要二者的条件概率非常接近(用相对熵来训练,所以需要label),那就说明高维分布的点已经映射到低维分布上了。   难点: 1.高维距离较近的点,比较方便
相关文章
相关标签/搜索