中文NLP-经常使用的特征选取方法

为何要作特征选取? 构建词向量是为了表征一篇/段文本,方便对文本的分析、分类等操做。对于一个文本,词向量是一维向量,每一个单元表征一个特征词。怎么获取这些特征词,简单粗暴的方法就是,对文本集(全部文本)进行分词操做,以后将不重复的词汇构成特征词集合,从而构建词向量。 举例进行说明:web “推进长江经济带发展是党中央做出的重大决策,是关系国家发展全局的重大战略,对实现“两个一百年”奋斗目标、实现中
相关文章
相关标签/搜索