pyhanlp 中文词性标注与分词简介

  pyhanlp实现的分词器有很多,同时pyhanlp获取hanlp中分词器也有两种方式 第一种是直接从封装好的hanlp类中获取,这种获取方式一共可以获取五种分词器,而现在默认的就是第一种维特比分词器 1.维特比 (viterbi):效率和效果的最佳平衡。也是最短路分词,HanLP最短路求解采用Viterbi算法 2.双数组trie树 (dat):极速词典分词,千万字符每秒(可能无法获取词性,
相关文章
相关标签/搜索