jieba分词详解

时间 2021-01-01

原文原文链接

语音识别中有一项任务就是训练语言模型，而对于中文的语言模型，需要事先进行分词。而语音识别中的语言模型还有个特殊的要求，就是语言模型中的所有词都必须在发音词典中(也就是说每个词都要有对应的发音)。因此这就限制了我们不能使用Stanford分词，哈工大分词等工具，因为这些分词工具分出来的词有可能不在发音词典中。现在在语音识别任务中最常使用的是scws机械分词，和jieba分词(把hmm分词选项关了)。

>>阅读原文<<

1. python 结巴分词(jieba)详解
2. [测]jieba分词
3. jieba库分词
4. Python3 jieba分词
5. Python-jieba分词
6. jieba 分词
7. jieba 分词生成词云
8. jieba分词wordcloud词云
9. jieba分词初学
10. nlp之jieba分词
更多相关文章...
• 免费ARP详解 - TCP/IP教程
• *.hbm.xml映射文件详解 - Hibernate教程
• Flink 数据传输及反压详解
• 常用的分布式事务解决方案