BiLSTM + CRF 命名实体识别实践(下)

0. 前言 上一篇博客简单讨论了理论知识,这篇博客主要是实践部分,主要针对上一篇博客中提到的代码的优化。优化点主要包含以下几个方面: (1)max_seq_len如何取值? (2)sequence_len不固定会给模型带来多大的提升? (3)batch_size不固定,方便预测 (4)词向量的预训练能给模型带来哪些好处? (5)特定业务场景下,如何迁移? 注:数据集为公开数据集boson.   1
相关文章
相关标签/搜索