NLP机器翻译任务中,如何用Bleu score评价翻译质量(学习心得)

机器翻译的一大难题是,一句法语句子,可以有多种英文翻译,这些翻译都是非常好的 那怎么去评估一个机器翻译系统的质量是不是好呢? 这不像图像识别,只有一个正确答案 通常我们有 BLEU score(Bilingual Evaluation Understudy 双语评估替补) 来解决 在戏曲界,understudy 指的是候补演员 假设我们拿到一句法语 同时得到几个人类翻译的结果(都是对的,也都很准确
相关文章
相关标签/搜索