[UFLDL] Linear Regression & Classification

时间 2019-11-18

标签 ufldl linear regression classification 繁體版

原文原文链接

博客内容取材于：http://www.cnblogs.com/tornadomeet/archive/2012/06/24/2560261.htmlphp

Deep learning：六(regularized logistic回归练习)
Deep learning：五(regularized线性回归练习)
Deep learning：四(logistic regression练习) 
Deep learning：三(Multivariance Linear Regression练习)
Deep learning：二(linear regression练习)

outline

参考资料：html

Comment: 难点很少，故补充CMU 10-702线性部分的章节。网络

本文主要是个归纳，具体内容还须要看具体章节讲解。dom

概念辨析

线性拟合是线性回归么？

回归，仅表示一个“repeative 回归过程”，或者叫作“回归模型”。ide

至于要解决什么问题，这要取决于 solver。函数

基本问题

Ref: https://www.zhihu.com/question/21329754tornado

- Logistic Regression 分类问题
- Linear Regression 拟合问题

- Support Vector Regression 拟合问题
- Support Vector Machine 分类问题

- Naive Bayes 拟合/分类均可以

- A multilayer perceptron (MLP)
- 前馈神经网络(如 CNN 系列) 用于分类和回归
- 循环神经网络(如 RNN 系列) 用于分类和回归

拟合：线性回归

简单模式：一元线性回归问题（一个因子）

Ref: Deep learning：二(linear regression练习)post

求：孩子的年纪和身高的关系，training过程。优化

进阶模式：多元线性回归问题（两个因子）

Ref: 三(Multivariance Linear Regression练习)url

【损失函数】其向量表达形式以下：

【参数更新】当使用梯度降低法进行参数的求解时，参数的更新公式以下：

就是感知器，一点小区别的是：1/m有没有必要的问题。

分类：线性分类

二分类 - 逻辑回归

基本原理

Ref: 四(logistic regression练习)

Ref: 一文读懂逻辑回归【比较全面】

【损失函数】采用cross-entropy as loss function:

　　

　　【参数更新】若是采用牛顿法来求解回归方程中的参数，则参数的迭代公式为：

　　

　　其中一阶导函数和hessian矩阵表达式以下：

　　

线性不可分 - 升维

五(regularized线性回归练习)

具备2个特征的一堆训练数据集，从该数据的分布能够看出它们并非很是线性可分的，所以颇有必要用更高阶的特征来模拟。

以下用到了特征值的5次方来求解。【升维的意义和思路】

　　

"正则项" 的意义

六(regularized logistic回归练习)

Regularization项在分类问题中（logistic回归）的应用。

没正则项：

有正则项：

Weight Decay: lamda的选择也能够看做是模型的选择。

小总结：

注意对比”拟合“与“分类”的公式表达的区别。

sigmoid + xentropy算是绝配。

多分类 - Softmax Regression

Ref: 十三(Softmax Regression)

Ref: 十四(Softmax Regression练习)

多分类问题，共有k个类别。在softmax regression中这时候的系统的方程为：

其中的参数sidta再也不是列向量，而是一个矩阵，矩阵的每一行能够看作是一个类别所对应分类器的参数【the parameters on edges (fan in) of Output Layer】，总共有k行。

因此矩阵sidta能够写成下面的形式：

【theta_i就是fan in的各个边的权重们】

“指数分布就有失忆性”

比较有趣的时，softmax regression中对参数的最优化求解不仅一个，每当求得一个优化参数时，若是将这个参数的每一项都减掉同一个数，其获得的损失函数值也是同样的。

这说明这个参数不是惟一解。用数学公式证实过程以下所示：

从宏观上能够这么理解，由于此时的损失函数不是严格非凸的，也就是说在局部最小值点附近是一个”平坦”的，因此在这个参数附近的值都是同样的了。

那么怎样避免这个问题呢？加入规则项就能够解决。

好比说，用牛顿法求解时，hession矩阵若是没有加入规则项，就有可能不是可逆的从而致使了刚才的状况，若是加入了规则项后该hession矩阵就不会不可逆。

损失函数的方程对比：【1{.}是一个指示性函数】

偏导函数对比：

若是要用梯度降低法，牛顿法，或者L-BFGS法求得系统的参数的话，就必须求出损失函数的偏导函数，softmax regression中损失函数的偏导函数以下所示：

网页教程中还介绍了softmax regression和k binary classifiers之间的区别和使用条件。总结就这么一个要点：

- 若是所需的分类类别之间是严格相互排斥的，也就是两种类别不能同时被一个样本占有，这时候应该使用softmax regression。[one-hot，严格互斥]
- 若是所需分类的类别之间容许某些重叠，这时候就应该使用binary classifiers了。[sigmoid原本就有中间地带]

相关文章

1. [UFLDL] Exercise 1C：Softmax Regression
2. regression+classification
3. Linear Models for Classification
4. Lecture 9: Linear Regression
5. Regression、Classification、Clustering
6. Linear regression
7. Linear Regression
8. linear regression
9. linear-regression
10. linear regression and logistic regression
更多相关文章...
• R 包 - R 语言教程
• SVG 渐变 - 线性 - SVG 教程

相关标签/搜索

logistic+regression

sigmoid+linear+mse+predict

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

1. [UFLDL] Exercise 1C：Softmax Regression
2. regression+classification
3. Linear Models for Classification
4. Lecture 9: Linear Regression
5. Regression、Classification、Clustering
6. Linear regression
7. Linear Regression
8. linear regression
9. linear-regression
10. linear regression and logistic regression

>>更多相关文章<<