基于LSTM实现新闻文本分类

  1 相关知识介绍 目前对于中文语句的分析来讲,其分词技术多采用Jieba分词技术,该技术是基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG);采用了动态规划(DP)查找最大概率路径,找出基于词频的最大切分组合;对于像各类专有分词、缩写词与新增词等未登录词没有收录在分词词表中,但是必须要切分出来,是采用基于汉字成词能力的HMM模型,使用了维特比(Viter
相关文章
相关标签/搜索