基于维基百科构建平行语料库

本文辅助有需求人士建立平行语料库。 工具GitHub链接https://github.com/clab/wikipedia-parallel-titles 第一步:从” https://en.wikipedia.org/wiki/List_of_ISO_639-2_codes” 上查看自己选的小语种的639-1码 第二步:假设我要做的是阿拉伯-英语平行语料库,阿拉伯语的639-1码为ar,英文的为
相关文章
相关标签/搜索