nlp阅读理解比赛经验贴

(一)比赛类型 多篇章阅读理解 篇章长度长 问题有多跳类型 没有yes no类型 (一)数据预处理 1、blue、rouge、f1、tfidf、bm25进行相似度度量 2、采用前1000字、与问题最相似的几句话的策略,效果都不好,只能达到76%的覆盖率 3、用相似度进行排序,将1-3个句子的前一句后两句,4-6个句子前一句后一句,7-10个句子本身,覆盖率提升到95%,平均长度1600,后期优化到
相关文章
相关标签/搜索