(三)语言模型和共现矩阵

1、语言模型 目的:克服one-hot、tf-idf方法中向量丢失句子中单词的位置关系信息 1)2-gram 假设语料库如下: John likes to watch movies. Mary likes too.John also likes to watch football games. 2-gram建立索引如下:(把每个句子中相邻的2个单词用一个编码表示,不再是以前的一个单词一个编码) “
相关文章
相关标签/搜索