【NLP理论】——文本在计算机中的表示方法总结

文章目录 1. 概述 2. 离散式表示(Discrete Representation) 2.1 One-Hot Demo 缺点 2.2 词袋模型(Bag Of Word,BOW) Demo 缺点 2.3 TF-IDF(词频-逆文档频率) 公式 优势 缺点 3. 分布式表示(Distributed Representation) 3.1 n-gram 缺点 3.2 共现矩阵(Co-Occurren
相关文章
相关标签/搜索