NLP 人与机器的对话

python 处理NLP问题 1.分词: 中文可用jieba库直接分词 英文依靠逗号 2.词形归一化(词干提取)(单词变体还原) 在英文中使用,可将动词一些变化转化为原型。 语言形态学和信息检索里,词干提取是去除词缀得到词根的过程,例如working的词干为work。 3.去除stopwords 将助词等去掉,留下较为纯粹的关键词。 stopwords有对应的成熟的数据库。 同义词问题 方法一 通
相关文章
相关标签/搜索