基于主题模型的专利文本主题挖掘与应用研究- 专利文本主题挖掘方法

基于分类 需要认为提前设定好一定的分类标准,并需要规定好各个主题类别信息,它是一种有监督或者半监督的方法,对于一个新文本的归类过程也是对其文本主题信息解读的过程。 基于聚类 无监督 通过对聚类各个类簇进行解读,从而发现文本的主题信息。 三种流程 基于分类号 从分类角度识别专利技术主题信息 专利文本通常都有IPC分类号,该分类号对解读文本技术主题信息具有重要作用。一个专利通常都有一个以上IPC分类号
相关文章
相关标签/搜索