Python实现根据评论评分信息预测 (协同过滤,LFM,词向量)

  一.数据集 train.dat共393366项,第一维是用户的代号,第二维是商品代号,第三项是用户对该商品的评分,第四项是评论数,第五项是评论内容。   test.dat第一维是用户代号,第二维是商品代号。   二.简单思路及实现过程 这里简单先贴出代码实现,后期再慢慢补上具体过程说明~ 1.数据预处理 去除部分无关常用词,这里调用nltk包,将评论词词词根化等,进行评论数据的预处理,存为ne
相关文章
相关标签/搜索