二值选择模型的stata操做与分析(一):logit模型

在经典计量经济学模型中,被解释变量一般被假定为连续变量,若被解释变量为离散变量,如Y=1,2,3 那么就称为离散被选择变量模型, 离散被解释变量模型分为二元选择模型和多元选择模型。这里介绍二元选择模型的stata操做与分析,即logit模型和probit模型。   nginx



1git


logit模型

二元选择模型就是因变量y只能取0或者1,以此创建的回归方程为:微信

可是这样直接设定模型,却不能保证估计后的结果y必定能够取值0或者1,因此引入y的几率的形式,即app

此时至关于y服从两点分布,取值在0-1之间。函数

若y选择服从logisitic几率分布,此时的模型就是logit模型,即:
spa

y经过logisitic几率分布函数F(y)转换为几率。将上述模型经过转换,能够获得:
.net

因为二元选择模型,包括logit模型的y是二分类的,因此其偏差的分布再也不是正态分布,而是二项分布,所以咱们就不能用最小二乘法OLS去估计它,而要用最大似然估计去估计模型。3d


2code


logit模型的stata操做

Stata中使用logit模型回归的命令语句格式以下:orm

logit y x1 x2 … [if] [in] [weight] [,options]

以贷款数据数据LOANAPP.dta为例,其数据以下所示:

用二值变量approve对种族变量white和其余自变量(hratobratloanprcunemmalemarrieddepschcosignchistpubrecmortlat1mortlat2vr)估计logit模型。

命令为:

logit approve white hrat obrat loanprc unem malemarried dep sch cosign chist pubrecmortlat1 mortlat2 vr

获得结果:

根据logit模型结果,其余变量取均值时white人群贷款申请批准的预测几率比nowhite人群几率多0.9378。



3


计算自变量的平均偏效应和比数比

根据上面logit模型的估算结果,得出white、married和loanprc的平均偏效应和比数比,并解释其含义。

采用stata得出white、married和loanprc的平均偏效应:

margins, dydx(white married loanprc)

获得结果:

根据结果,white的平均偏效应为0.0828,代表白人贷款申请批准的的预测几率平均比非白人高0.0828。



欢迎扫码关注,如有问题,请点击“在看”留言或在公众号里留言。


本文分享自微信公众号 - 博士的计量经济学干货(econometrics_ABC)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索