准备系统性地整理一下数据挖掘&机器学习常见方法,温故而知新,less is more。算法
先列一下初步目录:(每一个冒号后面是主要的focus)网络
1 关联规则挖掘:Apriori 算法& FP-treeless
2 贝叶斯方法:朴素贝叶斯&贝叶斯网络机器学习
3 组合提高:Boosting&Adaboost,随机森林学习
4 决策树系列:ID3,C4.5 &MART(又叫GBDT(Gradient Boosting Decision Tree) )ci
5 主题模型:LDA&PLSA数据挖掘
6 聚类算法,包括混合高斯模型io
7 回归分析,包括logistic,regularlization神经网络
8 EM方法
9 SVM
10 异常检测
11 KNN&推荐系统
12 随机模拟及抽样:MCMC
13 Deep learning 一些专题,包括特征提取,降维及神经网络
14 时间序列
15 海量数据处理方法
16 待补充
进度安排:
一周一至二篇,加油!