在经典计量经济学模型中,被解释变量一般被假定为连续变量,若被解释变量为离散变量,如Y=1,2,3 那么就称为离散被选择变量模型, 离散被解释变量模型分为二元选择模型和多元选择模型。这里介绍二元选择模型的stata操做与分析,即logit模型和probit模型。 nginx
1git
二元选择模型就是因变量y只能取0或者1,以此创建的回归方程为:微信
可是这样直接设定模型,却不能保证估计后的结果y必定能够取值0或者1,因此引入y的几率的形式,即app
此时至关于y服从两点分布,取值在0-1之间。函数
若y选择服从logisitic几率分布,此时的模型就是logit模型,即:
spa
y经过logisitic几率分布函数F(y)转换为几率。将上述模型经过转换,能够获得:
.net
因为二元选择模型,包括logit模型的y是二分类的,因此其偏差的分布再也不是正态分布,而是二项分布,所以咱们就不能用最小二乘法OLS去估计它,而要用最大似然估计去估计模型。3d
2code
Stata中使用logit模型回归的命令语句格式以下:orm
logit y x1 x2 … [if] [in] [weight] [,options]
以贷款数据数据LOANAPP.dta为例,其数据以下所示:
用二值变量approve对种族变量white和其余自变量(hrat、obrat、loanprc、unem、male、married、dep、sch、cosign、chist、pubrec、mortlat1、mortlat2和vr)估计logit模型。
命令为:
logit approve white hrat obrat loanprc unem malemarried dep sch cosign chist pubrecmortlat1 mortlat2 vr
获得结果:
根据logit模型结果,其余变量取均值时white人群贷款申请批准的预测几率比nowhite人群几率多0.9378。
3
根据上面logit模型的估算结果,得出white、married和loanprc的平均偏效应和比数比,并解释其含义。
采用stata得出white、married和loanprc的平均偏效应:
margins, dydx(white married loanprc)
获得结果:
根据结果,white的平均偏效应为0.0828,代表白人贷款申请批准的的预测几率平均比非白人高0.0828。
欢迎扫码关注,如有问题,请点击“在看”留言或在公众号里留言。
本文分享自微信公众号 - 博士的计量经济学干货(econometrics_ABC)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。