深度学习基础之特征工程概述——慕课学习笔记

2.1特征工程 引自知乎:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。” 自动分词就是将用自然语言书写的文章、句段经计算机处理后,以词为单位给以输出,为后续加工处理提供先决条件。 词根提取(stemming) :是抽取词的词干或词根形式(不一-定能够表达完整语义)。 词形还原(lemmatization) :是把词汇还原为一般形式(能表达完整语义)。如将“drove"处理为
相关文章
相关标签/搜索