342个中、英文等NLP开源数据集分享

    本资源整理了342个中文、英文等NLP相关的公开数据集,涉及文本分类、实体识别&词性标注、搜索匹配、推荐系统、指代消歧、百科数据、预训练词向量or模型等。blog     由于涉及数据集较多,建议你们按关键字搜索须要数据集和paper,能够去源网页:https://datasets.quantumstat.com/资源       打不开原网页的,能够下载带连接pdf资源,下载地址:pdf
相关文章
相关标签/搜索