Response Generation中BLEU、NIST评测方法的使用

最近准备AI Challenger的时候要用到BLEU、NIST等评价指标对机器翻译的效果进行评价,BLEU比较好找,NIST就比较麻烦了,在这记录一下使用方法 关于BLEU的介绍可以参考对话响应生成的无监督评估指标的实证研究 NIST(National Institute of standards and Technology)方法是在BLEU方法上的一种改进。最主要的是引入了每个n-gram的
相关文章
相关标签/搜索