Fine-tune BERT for Extractive Summarization中文数据集LCSTS复现

目前有关于Fine-tune BERT for Extractive Summarization代码只有英文数据集,未曾包含中文LCSTS的数据集,疫情在家期间尝试将代码转换到中文数据集中。 ** 一、数据转换篇 ** 根据源代码中对数据格式的要求,一个story文件中包含原文和摘要,以@highlight进行区分。 所以我们首先需要将原LCSTS数据集进行转换,原数据集的格式如下:经过转换后的数
相关文章
相关标签/搜索