首先咱们先对解释变量中的定性因素和定量因素做如下阐述:spa
在实际建模中,如何对定性因素进行回归分析?采用“虚拟变量”对定性变量进行量化是最经常使用的一种思路。其基本思想为:事件
虚拟变量设置的时候须要考虑如下的基本规则:数学
在计量经济学中,一般引入虚拟变量的方式分为加法方式和乘法方式两种。it
实质上,加法方式引入虚拟变量改变的是截距,乘法方式引入虚拟变量改变的是斜率。table
含有虚拟变量的模型的分析手段:条件指望。class
以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属性和引入虚拟变量的个数。主要有四种状况:基础
以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟变量与其它解释变量的乘积,做为新的解释变量出如今模型中,以达到其调整设定模型斜率系数的目的。变量
所谓虚拟变量的综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。基本分析方式仍然是条件指望分析。原理
结构变化的实质是检验所设定的模型在样本期内是否为同一模型。显然,平行回归、共点回归、不一样的回归三个模型均不是同一模型。方法
例:比较改革开放先后我国居民平均“储蓄—收入”总量关系是否发生变化?
模型设定为 :
\[Y_t=\alpha_1+\alpha_2D_t+\beta_1X_t+\beta_2(D_tX_t)+u_t \]其中:\(Y_t\) 为储蓄总额,\(X_t\) 为收入总额。
\[D=\left\{\begin{array}{cl} 1 \ \ , & \text{改革开放前} \\ 0 \ \ , & \text{改革开放后} \end{array}\right. \ . \]条件指望分析:
- 改革开放后:\({\rm E}(Y_t|X_t,\,D_t=1)=\alpha_1+\alpha_2+(\beta_1+\beta_2)X_t\) ;
- 改革开放前:\({\rm E}(Y_t|X_t,\,D_t=0)=\alpha_1+\beta_1X_t\) 。
只要 \(\alpha_2\) 和 \(\beta_2\) 不一样时为零,上述模型就能刻画改革开放先后我国居民平均“储蓄—收入”模型结构是否发生变化。
交互做用:一个解释变量的边际效应有时可能要依赖于另外一个解释变量。
例:研究人群的我的收入 \(Y\) 与其教育水平 \(E\) 和所在地区 \(D\) 的关系。
模型设定为:
\[Y=\alpha_0+\alpha_1D_1+\alpha_2D_2+\alpha_3E+\alpha_4D_1E+\alpha_5D_2E+u \ , \]其中
\[D_1=\left\{\begin{array}{cl} 1 \ \ , & \text{中部} \\ 0 \ \ , & \text{其余} \end{array}\right. \ , \ \ \ \ D_2=\left\{\begin{array}{cl} 1 \ \ , & \text{东部} \\ 0 \ \ , & \text{其余} \end{array}\right. \ , \ \ \ \ E=\left\{\begin{array}{cl} 1 \ \ , & \text{高等} \\ 0 \ \ , & \text{中等} \end{array}\right. \ . \]各种人员的收入表以下:
西部 \((0,\,0)\) 中部 \((1,\,0)\) 东部 \((0,\,1)\) 中等 \(E=0\) \(\alpha_0\) \(\alpha_0+\alpha_1\) \(\alpha_0+\alpha_2\) 高等 \(E=1\) \(\alpha_0+\alpha_3\) \(\alpha_0+\alpha_1+\alpha_3+\alpha_4\) \(\alpha_0+\alpha_2+\alpha_3+\alpha_5\) 差别性描述:
中部与西部差 东部与西部差 东部与中部差 中等 \(E=0\) \(\alpha_1\) \(\alpha_2\) \(\alpha_2-\alpha_1\) 高等 \(E=1\) \(\alpha_1+\alpha_4\) \(\alpha_2+\alpha_5\) \(\alpha_2-\alpha_1+\alpha_5-\alpha_4\) 各种人员的收入表以下:
西部 \((0,\,0)\) 中部 \((1,\,0)\) 东部 \((0,\,1)\) 高等与中等差 \(\alpha_3\) \(\alpha_3+\alpha_4\) \(\alpha_3+\alpha_5\)
双重差分法,Differences-in-Differences,基本思想就是经过对政策实施先后对照组和实验组之间差别的比较构造出反映政策效果的双重差分统计量。首先强调一点,通常而言 DID 仅适用于面板数据模型,但并无严格意义上面板数据模型所须要的过多的假设,经过引入虚拟变量并经过最小二乘法便可实现参数估计。所以咱们在讨论面板数据以前,先讨论双重差分模型的应用。
前提假设:
模型设定:
其中,\(Y_{it}\) 为个体 \(i\) 在 \(t\) 期的结果值,
对 DID 模型取数学指望:
对照组+实验前
对照组+实验后
实验组+实验前
对照组+实验前
为了方便对比参数设定的意义,咱们用以下的表格:
对照组 | 实验组 | |
---|---|---|
实验前 | \(\alpha\) | \(\alpha+\alpha_1\) |
实验后 | \(\alpha+\alpha_2\) | \(\alpha+\alpha_1+\alpha_2+\beta\) |
Difference | \(\alpha_2\) | \(\alpha_2+\beta\) |
将双重差分的思想与上表的内容结合,咱们能够获得政策的净效应:
关键:检验交叉项系数 \(\hat\beta\) 是否显著。