泛统计理论初探——文本挖掘中的词袋模型

数据挖掘-初探文本挖掘 文本挖掘之词袋模型 在我们开始接触文本挖掘的时候,一般都会有疑问,什么是文本挖掘,作者认为可以通过文本挖掘来得出文章的主题、特征等,也可以通过当前的词义、语义、语境等上下文信息进行预测,文本挖掘的用处十分广泛,比如比较两篇文章的风格判断作者是否同一个人,比如通过RNN、LSTM等模型生成诗歌、散文等。而我们最早接触的文本挖掘,其实是是通过分词开始进行学习的,即把一篇文章分为
相关文章
相关标签/搜索