基于注意力机制的 中 英机器翻译

数据处理模块 数据介绍 语料介绍一下: data文件夹有如下文件: cn.txt:中文语料,里面的句子都已经分好了词。 en.txt: 英语对齐语料,里面的单词也分词完毕。 cn.text.txt: 中文测试集语料 en.tetx.txt:英语对齐测试集语料 cn.txt.vab:中文词典文件 en.txt.vab:英语词典文件 语料一共才6000多个对齐的句子。因此,在生成词典的时候,没有做词频
相关文章
相关标签/搜索