6、摘要提取算法

目前主要方法有: 基于统计:统计词频,位置等信息,计算句子权值,再简选取权值高的句子作为文摘,特点:简单易用,但对词句的使用大多仅停留在表面信息。 基于图模型:构建拓扑结构图,对词句进行排序。例如,TextRank/LexRank 基于潜在语义:使用主题模型,挖掘词句隐藏信息。例如,采用LDA,HMM 基于整数规划:将文摘问题转为整数线性规划,求全局最优解。 TextRank 算法是一种用于文本的
相关文章
相关标签/搜索