使用HMM进行中文分词

1、代码 # %load hmm_segment.py   # (1)经过对语料库进行统计,创建隐马尔科夫链模型(初始几率,转移几率,观测几率) # (2)经过维特比算法(动态规划),确立某具体语句按其顺序出现每一个字时,每一个字对应的最大可能状态。 # (3)肯定了每一个字对应的状态,按('BM*E|S')的模式进行分词    # B表明词开始,M表明词的中间,E表明词的结尾。S表明单字词  M
相关文章
相关标签/搜索