1. PyTorch概述

 

 

 

 

1. 课程目标

使用PyTorch实现学习系统

理解神经网络/深度学习的基本概念

 

 

2. 所需基础

线性代数、概率论

Python

 

 

3. 机器学习算法与数据结构算法的区别

之前的算法有穷举、贪心、动规、分治等等。当遇到一个问题的时候,需要基于这些思维方法,人工设计出一套计算的过程。

但是在机器学习里面,算法不是设计出来的。而是有数据集,通过数据集把想要的算法给找出来。这就是一个机器学习的过程。

 

 

4. 维度灾难

样本feature数量为n,n越大则对样本的需求越多。

比如数据只有一个feature,那么就是在一维空间里面进行采样,假设采了10个样本就能够满足大数定律,能够表示原来的数据。

如果数据有2个特征,那么就是在2个feature的空间里进行采样,这时候需要10*10的样本,这样密度才能跟前面的对应。

如果数据有3个特征,在3维空间采样,需要10^3,才能维持相同的密度。

。。。

featrue为n,对数据的需求量越大。

 

收集数据本身工作量就非常大。所以数据集是非常贵的。

 

 

 

 

5. 模型

 

 

6. 框架

pytorch 、 TensorFlow