自然语言处理之文本相似度

1、文本相似度: 1) 语义相似、但字面不相似 2) 字面相似、但是语义不相似 2、方案: 1) 语义相似:依靠用户行为,最基本的方法:(1)基于共点击的行为(协同过滤),(2)借助回归算法 2) 字面相似:(1) LCS最大公共子序列 (2) 利用中文分词 3 字面相似的问题解决:        余弦相似度 cosine                     举例:A(1,2,3),B(2,3
相关文章
相关标签/搜索