中文分词的一些最新研究进展

最近,读了几篇这两年发表的关于分词的会议论文,发现如今主要的研究方向是解决分词的领域适用问题,采用的主要模型是已有的分词算法+训练集+部分标记语料的半监督学习方式,分词算法包括感知器、条件随机场,部分标记的语料主要为维基百科的汉语语料http://dumps.wikimedia.org/backup-index.html。如今主要介绍一下各文章的关注重点和异同。html 由于水平问题或对论文自己的
相关文章
相关标签/搜索