推荐系统学习笔记——十二、结巴分词用于内容相似推荐

十二、结巴分词用于内容相似推荐 计算物品最相似的其他物品,直接用于I2I相似推荐,或者U2I2I推荐 以文章为例,进行内容相似推荐,一般需要以下几个步骤: 内容获取 一般包含ID、标题、介绍、详情等,存储于MySQL数据库中。批量查取这些内容,进行下一步 中文分词:提取关键词 中文没有空格进行分词,所以需要手动分词,使用TFIDF技术,jieba分词 结巴分词,中文分词组件,三种模式:全模式、精确
相关文章
相关标签/搜索