命名实体识别_利用CRF_CodingPark编程公园

文章介绍 本文主要讲解 原始语料库 -> 语料清洗 -> 语料分割 -> 构建训练和测试数据 -> CRF++训练 -> 命名实体检索 -> 模型评估html 完整项目 原始语料库 以人民日报1998年01月语料库为例子 python 语料清洗 (1)将语料全角字符(SBC)统一转为半角(DBC) (2)三空格变双空格 标注和标注之间的间隔规定为双空格,可是会存在一些三空格 (3)单空格变为双空格
相关文章
相关标签/搜索