Greedy NLP Learning Notes(二)

1.NLP项目的流程 NLP pipeline Normalizaition:英文中应用比较多,如apple、apples=>apple;go、went=>go。 2.分词 word segentation 2.1.基于匹配规则的分词方法 前向最大匹配(贪心算法) 前向最大匹配 后向最大匹配(贪心算法) 后向最大匹配 「基于匹配规则的分词法」的缺点: 只能找局部最优的解 max_len导致效率低下
相关文章
相关标签/搜索