论文阅读-RankME: Reliable Human Ratings for Natural Language Generation

人工评价仍然是NLG任务主流的评价方式。本文旨在提高人工评价质量。 CrowdFlower 的代码,但是感觉都是前端页面的代码。。 相关方法 名称 全称 释义 Likert 李克特量表 ME magnitude estimation 量值估计 plan ME plain magnitude estimation 简单量值估计 RankME rank-based magnitude estimati
相关文章
相关标签/搜索