Wikitext-103-数据集

本数据集是超过 1 亿个语句的数据合集,全部从维基百科的 Good 与 Featured 文章中提炼出来。广泛用于语言建模,当中 包括 fastai 库和 ULMFiT 算法中经常用到的预训练模型。 Recent neural network sequence models with softmax classifiers have achieved their best language mod
相关文章
相关标签/搜索