无监督数据场景下信息抽取问题

笔者现在有一批DWPI的专利数据,内含每一项专利的标题和摘要,时间跨度从2010-2020年,共计17万条。现操作要求是对每一项专利的标题进行关键技术术语抽取。如 此任务为探索性任务,笔者希望能用此博客记录下探索过程中的思考和成效。 探索一,将此任务转化为了术语标注问题,即自动对术语进行BIO的标注,然后再对标注好的短语做抽取。在此任务框架下,笔者想要先试试已经训练好的几个模型,直接得到标注好的结
相关文章
相关标签/搜索