文本分类——算法性能评估

内容提要 数据集 英文语料 中文语料 评估指标 召回率与准确率 F1-评测值 微平均与宏平均 混淆矩阵   优秀的文本分类模型必须经得住真实数据集的验证,于是分类器必须在通用的数据集上进行测试。用于文本分类的数据集通常称为语料库。   语料库指经科学取样和加工的大规模电子文本库。借助计算机分析工具,研究者可开展相关的语言理论及应用研究。语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库
相关文章
相关标签/搜索