本文首发自 产品经理的 AI 知识库python
原文地址:《一文看懂线性回归(3个优缺点+8种方法评测)》算法
线性回归是很基础的机器学习算法,本文将通俗易懂的介绍线性回归的基本概念,优缺点,8 种方法的速度评测,还有和逻辑回归的比较。机器学习
线性回归的位置如上图所示,它属于机器学习 - 监督学习 - 回归 - 线性回归。函数
扩展阅读:学习
《一文看懂机器学习!(3种学习方法+7个实操步骤+15种常见算法)》3d
《一文看懂监督学习(基本概念+4步流程+9个典型算法)》code
什么是回归?cdn
回归的目的是为了预测,好比预测明天的天气温度,预测股票的走势...blog
回归之因此能预测是由于他经过历史数据,摸透了“套路”,而后经过这个套路来预测将来的结果。ip
什么是线性?
“越...,越...”符合这种说法的就多是线性个关系:
「房子」越大,「租金」就越高
「汉堡」买的越多,花的「钱」就越多
杯子里的「水」越多,「重量」就越大
......
可是并不是全部“越...,越...”都是线性的,好比“充电越久,电量越高”,他就相似下面的非线性曲线:
线性关系不单单只能存在 2 个变量(二维平面)。3 个变量时(三维空间),线性关系就是一个平面,4 个变量时(四维空间),线性关系就是一个体。以此类推...
什么是线性回归?
线性回归原本是是统计学里的概念,如今常常被用在机器学习中。
若是 2 个或者多个变量之间存在“线性关系”,那么咱们就能够经过历史数据,摸清变量之间的“套路”,创建一个有效的模型,来预测将来的变量结果。
优势:
缺点:不能很好地拟合非线性数据。因此须要先判断变量之间是不是线性关系。
为何在深度学习大杀四方的今天还使用线性回归呢?
一方面,线性回归所可以模拟的关系其实远不止线性关系。线性回归中的“线性”指的是系数的线性,而经过对特征的非线性变换,以及广义线性模型的推广,输出和特征之间的函数关系能够是高度非线性的。另外一方面,也是更为重要的一点,线性模型的易解释性使得它在物理学、经济学、商学等领域中占据了难以取代的地位。
结果:使人惊讶的是,与普遍被使用的scikit-learnlinear_model相比,简单矩阵的逆求解的方案反而更加快速。
详细评测能够查看原文《Data science with Python: 8 ways to do linear regression and measure their speed》
线性回归和逻辑回归是 2 种经典的算法。常常被拿来作比较,下面整理了一些二者的区别:
注:
自变量:主动操做的变量,能够看作「因变量」的缘由
因变量:由于「自变量」的变化而变化,能够看作「自变量」的结果。也是咱们想要预测的结果。