语言模型的评估-困惑度

语言模型评价测试 语言模型构造完成后,如何肯定好坏呢? 目前主要有两种评价方法:spa 实用方法:经过查看该模型在实际应用(如拼写检查、机器翻译)中的表现来评价,优势是直观、实用,缺点是缺少针对性、不够客观; 理论方法:迷惑度/困惑度/混乱度(preplexity),其基本思想是给测试集的句子赋予较高几率值的语言模型较好,当语言模型训练完以后,测试集中的句子都是正常的句子,那么训练好的模型就是在测
相关文章
相关标签/搜索