机器学习机基础总结(一)数据清洗

数据清洗 Pandas Fuzzy-Levenshtein distence Fuzzywuzzy提供了语言的模糊查询或者替换等 PCA主成分分析 PCA主成分分析算法(Principal Components Analysis)是一种最常用的降维算法。能够以较低的信息损失(以样本间分布方差衡量)减少特征数量。 PCA算法可以帮助分析样本中分布差异最大的成分(主成分),有助于数据可视化(降低到2维
相关文章
相关标签/搜索