机器学习导图系列(1):数据处理

机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中具体释义并未完善,须要开发者本身探索才能对具体知识有深刻的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文做者对其项目进行翻译、整理、批注等二次创做,其中不乏生僻的数学名词,对于没有留过学的做者来讲费了不少功夫。我又将导图整理成了知识卡片,方便你们查看。因为机器学习的知识网络很大,致使完整的导图过大,文章中的图片可能通过压缩,如需完整图片可查看github项目machine-learning-mindmap-cn下载高清原图。本系列还在持续创做中,你的点赞、留言、star都会成为我持续创做的动力。git

Daniel Formoso: https://github.com/dformoso/m...
machine-learning-mindmap-cn: https://github.com/caiyongji/...github

机器学习导图系列分为五大模块。算法

  1. 机器学习数据处理
  2. 机器学习概念
  3. 机器学习过程
  4. 机器学习算法
  5. 机器学习模型及神经网络模型

图片描述

数据类型

图片描述

数据探索

图片描述

数据清洗

图片描述

特征插补

图片描述

特征工程

图片描述

特征选择

图片描述

特征编码

图片描述

特征归一化(Normalisation)或缩放(Scaling)

图片描述

构造数据集

图片描述

最后

你随手就是一个赞。网络

相关文章
相关标签/搜索