PKU Paraphrase Bank文章笔记:句级中文文本复述语料库

前两天查文本复述的资料的时候发现9月30号北大release了一批中文文本复述语料,就去看了一下,发现这篇文章用的方法都比较经典,易于理解,在这里做一个总结。 文章目录 文本复述定义 语料库概况 数据来源 数据规模 无监督语料库生成方法 流程概览 数据预处理 分数模型 整体模型 SCORE函数之完全匹配得分 SCORE函数之语义得分 SCORE函数的线性组合 计算的优化 位置限定 快速剪枝 语料库
相关文章
相关标签/搜索