图文并茂,700 页的机器学习笔记火了!值得学习

最近在学习机器学习,看到了这份笔记,介绍的很是详细,记录一下做为学习。

图片

做者

梁劲(Jim Liang),来自 SAP (全球第一大商业软件公司)。算法

书籍特色

条理清晰,含图像化表示更加易懂,对公式有详细的注解等。网络

内容概要

主要分为基本概念、经常使用算法和其余三部分。
图片架构

为何会这样?机器学习

  • 首当其冲就是数学,涉及统计学、微积分、几率、线性代数等,你们虽然都学太高等数学,但若是你还记得里面的细节,算你牛。更可能的状况是,多数人都对高等数学忘记了,面对各类算法里的大量公式,感到厌恶,甚至恐惧。
  • 其次由于机器学习自己是一个综合性学科,并且是一个快速发展的学科,知识点散乱,缺少系统性。
  • 市面上的机器学习/深度学习书籍、文章、教程,遍地开花,但能以清晰的方式表达、按部就班地讲解的教程,其实很少,大量的教程没有考虑到学习者的基础,使得初学者感到挫败和困惑。
  • 正是对机器学习的过程当中的痛苦有切身体会,做者Jim Liang但愿能作一份教程,以浅显易懂的方式去讲解它,下降你们的学习门槛。为此花费了数月时间,常常作到深夜,把本身的学习笔记整理成了这份教程。

Part 1 介绍了基本概念,包括:

  • 机器学习的流程
  • 数据处理
  • 建模
  • 评估指标(如 MSE、ROC 曲线)
  • 模型部署
  • 过分拟合
  • 正则化等

在第一部分,做者先介绍了现在应用广泛的机器学习:从自动驾驶、语音助手到机器人。其中有些思想,也是众多读者们了解过的,例如:为什么机器学习在这个时候会火(大数据、计算力、更好的算法);机器学习、人工智能、深度学习三者的关系等。函数

除了这些基础概念,这份教程也对机器学习模型的开发流程作了图像化展现(以下图),即便对此不太了解的读者,也能经过这种流程展现有所学习。
图片
图片学习

机器学习700页笔记电子版:

公众号【计算机视觉联盟】后台回复:9001,便可获取电子版大数据

在Part2,做者介绍了经常使用的算法,包括:

  • 线性回归
  • 逻辑回归
  • 神经网络
  • SVM
  • Knn
  • K-Means
  • 决策树
  • 随机森林
  • AdaBoost
  • 朴素贝叶斯
  • 梯度降低
  • 主成分分析

这部分包含了大量的数学公式,但做者尽力注解了其中的每一个公式,从而充分、清晰地表达了众多数学概念。人工智能

例如在「神经网络」部分,做者整理了 59 页的笔记(从 311 页到 369 页)。做者从人脑中的神经元架构提及,介绍了人工神经网络(ANN)、人工神经元工做的原理。这份笔记很是注重图像化的概念解释,理解起来很是直观。spa

例如,下图中的概念解释很形象地展示了生物神经元和人工神经元工做方式的类似性。blog

过拟合的解释
生物神经元的树突输入-轴突输出模式和人工神经元的输入输出模式对比。

在涉及到数学公式时,做者会在旁边有详细的注解,以下图所示:

图片
对于并列的可选项(如激活函数、经常使用神经网络架构等),也会有全面的列表:

对于神经网络中较为复杂的概念(如求导、反向传播),几张图就能解释清楚:

反向传播算法完整流程。

前向传播部分的计算细节。

为了方便你们学习,咱们已经准备好了完整版的机器学习笔记PDF,感兴趣的同窗能够按照下述步骤便捷获取:

机器学习700页笔记电子版:

公众号【计算机视觉联盟】后台回复:9001,便可获取电子版

相关文章
相关标签/搜索