【转载】广义线性模型

http://blog.csdn.net/v1_vivian/article/details/52055760
 
上篇博文中,咱们知道了指数分布族,它的定义式为:
 

 

此次咱们要了解的广义线性模型,是基于指数分布族的,咱们能够经过指数分布族引出广义线性模型(Generalized LinearModel,GLM)。这种模型是把自变量的线性预测函数看成因变量的估计值。函数

 

实际上线性最小二乘回归和Logistic回归都是广义线性模型的一个特例。当随机变量y服从高斯分布,η与正太分布的参数μ的关系是相等,那么获得的是线性最小二乘回归,当随机变量y服从伯努利分布,η与参数φ的关系是logistic函数,咱们获得logistic回归。spa

 

由此能够看出,η以不一样的映射函数与其它几率分布函数中的参数发生联系,从而获得不一样的模型,广义线性模型正式将指数分布族中的全部成员(每一个成员正好有一个这样的联系)都做为线性模型的扩展,经过各类非线性的链接函数将线性函数映射到其它空间从而大大扩大了线性模型可解决的问题。.net

 
 
如何根据指数分布族来构建广义线性模型?
 
GLM以三个假设为前提:
 
(1)给定特征属性 和参数 后, 的条件几率 服从指数分布族,即
 
(2)给定一个x,预测T(y)的指望值为:
 
(3) 之间是线性的,即
 

 

依据这三个假设,咱们能够推导出logistic模型与最小二乘模型。blog

 

对于最小二乘模型,推导过程以下:io

 

Logistic模型的推导过程以下:function

                       

 

 

 
 

其中,将η与原始几率分布中的参数联系起来的函数称为正则响应函数(canonical response function),如便是正则响应函数。变量

正则响应函数的逆称为正则关联函数(canonical link function)。扩展

 
因此,对于广义线性模型,须要决策的是选用什么样的分布,当选取高斯分布时,咱们就获得最小二乘模型,当选取伯努利分布时,咱们获得logistic模型,这里所说的模型是假设函数h的形式。
 
总结一下,广义线性模型经过假设一个几率分布,获得不一样的模型,而以前所讨论的梯度降低,牛顿方法都是为了求取模型中的线性部分 的参数θ。
相关文章
相关标签/搜索