语言模型的评估-困惑度

时间 2020-07-25

原文原文链接

语言模型评价测试语言模型构造完成后，如何肯定好坏呢？目前主要有两种评价方法：spa 实用方法：经过查看该模型在实际应用（如拼写检查、机器翻译）中的表现来评价，优势是直观、实用，缺点是缺少针对性、不够客观；理论方法：迷惑度/困惑度/混乱度（preplexity），其基本思想是给测试集的句子赋予较高几率值的语言模型较好,当语言模型训练完以后，测试集中的句子都是正常的句子，那么训练好的模型就是在测

>>阅读原文<<