文本分析算法简单介绍-1

        以下内容是基于李博《机器学习实践应用》,邹博小象学院《机器学习课程》以及李航书籍《统计学习方法》加上自己的理解提炼而成 文本分析算法大致可以分成3种方法:机械分词,统计分词和机器学习分词。 1)机械分词:机械分词就是从一个很大的词库种找出匹配的词语,将其筛选出来。该方法实现非常简单,但是有一些问题:效率问题,因为要遍历一边词库,所以复杂度将会是O(m * n),m代表的是文档中文字
相关文章
相关标签/搜索