800万中文词,腾讯AI Lab开源大规模NLP数据集

参加 2018 AI开发者大会,请点击 ↑↑↑ 10 月19 日,腾讯 AI Lab 宣布开源大规模、高质量的中文词向量数据。该数据包含 800 多万中文词汇。 腾讯 AI Lab 表示,相比现有的公开数据,该数据在覆盖率、新鲜度及准确性上大幅提高,为对话回复质量预测和医疗实体识别等自然语言处理方向的业务应用带来显著的效能提升。 ▌腾讯 AI Lab 词向量的特点 腾讯 AI Lab 此次公开的中
相关文章
相关标签/搜索