张开旭:分词不是一个独立的任务,大量无标注语料是真正的金矿

作者:张开旭 CLPS-SIGHAN2012微博分词评测第一名 最近看大家在微博上讨论分词。作为一个分词的同好,我也是有分词情怀的。我是12年毕业的NLP博士。(注:NLP是神经语言程序学 (Neuro-Linguistic Programming))课题就是分词,做课题期间读了几乎所有的主要文献,也自己重现过主流的方法,包括最大匹配,CRF,感知器,基于词的方法等等。 遗憾的是自己没有写出高水平
相关文章
相关标签/搜索