基于CNN和词向量的文本相似度分析

时间 2020-12-23

原文原文链接

1. 前言众所周知，现在的时代就是海量数据暴增的时代，每天的各种聊天工具和数以亿计的网页产生了海量的人工无法高效处理的各种文字信息。由此而生，我们自然想到通过分类来减少信息检索，分类的依据就是文本之间的相似度，同时人们希望电脑能帮助人们来实现这一难题，从而各种基于语句格式和语义统计的语言表示方法诞生了。在这样一个大环境下，人们接触文本数据也越来越多，而在中文的语义环境下，每一个

>>阅读原文<<