腾讯AI Lab开源大规模高质量中文词向量数据，800万中文词随你用

时间 2021-01-12

原文原文链接

感谢阅读腾讯AI Lab第45篇文章。本文将介绍大规模高质量的中文词向量数据的开源情况。今日，腾讯AI Lab 宣布开源大规模、高质量的中文词向量数据。该数据包含800多万中文词汇，相比现有的公开数据，在覆盖率、新鲜度及准确性上大幅提高，为对话回复质量预测和医疗实体识别等自然语言处理方向的业务应用带来显著的效能提升。针对业界现有的中文词向量公开数据的稀缺和不足，腾讯 AI Lab此次开源，可为中

>>阅读原文<<