文本分类(1)-文本预处理

在进行文本分类以前,须要对文本进行预处理。中文文本和英文文本预处理的方式有所差异。 (1)英文文本预处理 文本预处理过程大体分为如下几点: 一、英文缩写替换 预处理过程当中须要把英文缩写进行替换,如it’s和it is是等价的,won’t和will not也是等价的,等等。git text = "The story loses its bite in a last-minute happy end
相关文章
相关标签/搜索