实体知识+字典树辅助jieba的分词(并对三国演义进行简单分析)

      在作中文NLP的时候,分词可谓是基础中的基础。然而这个基础部分的内容直到今天仍是让人不省心,在实际应用中【尤为是在人名等实体的识别上】老是显得漏洞百出。下面以python上比较流行的一个中文分词库jieba为例,看看它的一次表现:python import jieba print(" ".join(jieba.cut("""玄德谢别二客,便命良匠打造双股剑。 云长造青龙偃月刀,又名“冷
相关文章
相关标签/搜索