广义线性模介绍

  • 通常线性模型
 
也有表示为

必须知足
一、偏差项   知足变异一致
二、X,Y都是取连续值的变量,如农做物的产量,人的身高体重之类的
三、Y 的分布为正态,或接近正态分布之分布且互相独立

  • 通常线性模型的局限性
总的来讲,通常线性模型,经过一系列连续型和/或类别型预测变量来预测正态分布的响应变量,当在不少状况下,假设因变量为正态分布(甚至连续型变量)并不合理,例以下面这几种状况
a、结果变量是类别型的:二值变量(好比:是/否,经过/未经过,活着/死亡)和多分类变量(好比差/良好/优秀)都显然不是正态分布
b、结果变量多是计数的:一周的交通事故的数目,每日酒水消耗数量,这些都是非负的有限值,并且他们的均值和方差一般都是相关的(正态分布变量间不是如此,而是互相独立)

  • 广义线性模型

 是自变数的一个线性预测 函数

g()叫作链接函数,是一个非递减的可微函数,描述 y 的指望与    之间的关系spa


也有表示为
g(μy)是条件均值的函数(称为链接函数),另外能够放松 Y 为正态分布的假设,该为 Y 服从指数分布族中的一种分布便可,设定好链接函数和几率分布后,即可以经过最大似然估计的屡次迭代推导出各参数值

注意
广义线性模型经过 响应变量的条件均值的一个函数(不是响应变量的条件均值),假设响应变量服从指数分布族中的某个分布(并不限于正态分布)

指数分布族的定义:

  • 指数分布族下的广义线性模型
 

 是与方差有关的参数,叫作尺度参数(scale parameter) .net


  • 广义线性模型的适用场景
广义线性模型是常见的正态线性模型的直接推广,它可适用于连续数据和离散数据,如计数数据、属性数据

  • 广义线性模型变量类型
自变量:尺度变量,分类变量,其交互项
因变量:连续变量,两分类变量和计数数据

  • 广义线性模型的特例以模型范围
线性回归模型、方差分析模型、用于列联表分析的对数线性模型和两分类数据的logistic回归模型等都是广义线性模型
相关文章
相关标签/搜索