基于CRF序列标注的中文依存句法分析器的Java实现

这是一个基于CRF的中文依存句法分析器,内部CRF模型的特征函数采用 双数组Trie树(DoubleArrayTrie)储存,解码采用特化的维特比后向算法。相较于《最大熵依存句法分析器的实现》,分析速度翻了一倍,达到了1262.8655 sent/s 开源项目 本文代码已集成到HanLP中开源项目中,最新hanlp1.7版本已经发布 CRF简介 CRF是序列标注场景中常用的模型,比HMM能利用更多
相关文章
相关标签/搜索