2-常见机器学习模型总结

时间 2019-11-09

标签常见机器学习模型总结繁體版

原文原文链接

1、机器学习模型按照可以使用的数据类型分为监督学习和无监督学习两大类。算法

　　1-监督学习主要包括用于分类和用于回归的模型：机器学习

　　　　1）分类：线性分类器（如LR)、支持向量机（SVM）、朴素贝叶斯（NB）、K近邻（KNN）、决策树（DT）、集成模型（RF/GDBT等）函数

　　　　2）回归：线性回归、支持向量机（SVM）、K近邻（KNN）、回归树（DT）、集成模型（ExtraTrees/RF/GDBT）性能

　　2-无监督学习主要包括：数据聚类（K-means）/ 数据降维（PCA）等等.学习

2、根据模型特性而言：spa

　　1-各个模型分别基于哪些数学假设、适合处理什么样的数据、优缺点、评测指标及其计算方法ci

模型名称	数学假设	模型优缺点	评测指标及其计算方法
LR	假设特征与分类结果存在线性关系数学使用sigmoid函数映射到0-1io	与随机梯度上升算法相比，预测精度准确，table 可是耗费时间长	准确性（Accuracy）召回率（Recall）精确率（Precision）以及F1
NB	各个维度上的特征被分类的条件概率之间是相互独立的、贝叶斯公式	普遍用于文本分类优势：速度快，参数估计的个数锐减缺点：在特征关联性较强的任务性能差	同上
集成模型	训练多个模型 RF---bagging GDBT----boosting 模型融合相关内容	优势：性能高、稳定性强、普遍应用于工业界缺点：训练时间长，调参是体力活 xgb、lightGBM是比较快的	同上
回归相关的模型	SVM有三种核函数（linear/poly/rbf）		R^2/MAE/MSE/RMSE