格兰杰因果关系(Granger causality )是基于预测的因果关系统计概念。根据格兰杰因果关系,若是信号X1“格兰杰Causes”(或“G-Causes”)信号X2,则X1的过去值应该包含有助于预测X2的信息,而且超过仅包含在X2的过去值中的信息。其数学公式基于随机过程的线性回归模型(Granger 1969)。固然也有对非线性状况的扩展,可是这些扩展在实践中一般更难以应用。函数
格兰杰因果关系(或“G因果关系”)于20世纪60年代发展起来,自那以来,已普遍应用于经济学。然而,仅仅在过去的几年里,神经科学的应用开始流行起来。测试
关于如何定义因果关系的话题让哲学家们忙了两千多年,可是如今都尚未获得解决。这是一个使人深思的问题,有许多种答案试图解释因果关系,但都并不能使全部人信服,它仍然具备必定的挑战性。研究者但愿,若是他们认为已经找到了一个“缘由”,这应该是一个深入的基本关系,而且拥有potential。ui
在20世纪60年代早期,我(Clive Granger)正在考虑一对明显相互关联的随机过程,我想知道这种关系是否能够分解为一对单向关系。有人建议我看一下很是着名的数学家Norbert Weiner提出的因果关系的定义,因此我将这个定义(Wiener 1956)改编成实用的形式并进行了讨论。spa
应用经济学家发现这个定义便于理解和应用,而且它的具体应用开始出现。可是,有几位做者表示,“固然,这不是真正的因果关系,它只是格兰杰因果关系。”所以,从一开始,在实际应用中,使用Granger Causality这个术语来区别于其余定义。3d
基本的“Granger因果关系”定义很是简单。假设咱们有三项Xt,Yt和Wt,而且咱们首先尝试使用过去的Xt和Wt项来预测Xt+1。而后咱们尝试使用过去的Xt,Yt和Wt来预测Xt+1。若是根据标准成本函数,发现第二个预测更成功,那么Y的过去彷佛包含有助于预测Xt+1的信息,这些信息并不包含在过去的Xt或Wt。特别是,向量Wt多是一个可解释的变量。所以,Yt会“格兰杰致使”Xt+1,若是(a)Yt出如今Xt+1以前; 而且(b)它包含可以预测Xt+1中有用的信息,这些信息在其余合适的变量中找不到。orm
固然,Wt越大,选择的内容就越仔细,Yt越严格。最终,Yt可能彷佛包含有关Xt+1的独特信息,这在其余变量中找不到,这就是为何“因果关系”标签多是合适的。blog
这个定义很大程度上依赖于缘由cause出如今效应effect以前,这是大多数因果关系定义的基础,但并非所有。一些含义是Yt可能致使Xt+1,Xt致使Yt+1,至关因而一个反馈随机系统。可是,对于肯定性过程(例如指数趋势)是不多是casuse或者caused by另外一个变量。数学
人们广泛认为,虽然它不能涵盖因果关系的全部方面,但足以在实际测试中得以应用。it
G-因果关系一般在线性回归模型的背景下进行测试。为了说明,考虑两个变量X1和X2的二元线性自回归模型:io
其中p是包含在模型中的滞后观测值的最大数量(模型阶数),矩阵A包含模型的系数(即,每一个滞后观测值对X1(t)和X2(t)的贡献,E1和E2是每一个时间序列的残差(预测偏差)。 在第一(或第二)方程中包含X2(或X1),若是E1(或E2)的方差下降了,则称X2(或X1) Granger-(G)-causes X1(或X2)。换句话说,若是A12中的系数与0显著不一样,X2 G-引发X1。这能够经过F-test, 根据0假设A12 = 0,假设X1和X2协方差平稳,G因果互做用的大小能够用相应的F统计量的对数来估计(Geweke 1982)。 实际中要注意模型选择标准,如贝叶斯信息标准(BIC,(Schwartz 1978))或Akaike信息标准(AIC,(Akaike 1974))能够用来肯定合适的模型阶数p。
正如上面所述,G因果关系能够很容易地扩展到n变量的状况,其中n> 2,估计一个n变量自回归模型。在这种状况下,若是X2的滞后观测值有助于预测X1时,而且同时也考虑到全部其余变量X3 ... XN的滞后观测值,那么X2 G-将致使X1。 (这里,'X3 ... XN对应于上一节中集合W中的变量; 另请参阅Boudjellaba et al。(1992)关于使用自回归移动平均(ARMA)模型的解释。)此多变量扩展版本,有时被称为'条件'G因果关系(Ding et al. 2006)是很是有用的,由于多个变量之间的重复配对分析有时会产生使人误解的结果。例如,重复的双变量分析将没法消除下图中两种链接模式的歧义。相比之下,条件/多变量分析将推断X到Y的因果关系,只要X中的过去信息有助于预测将来Y和超越beyond这些信号由Z为中介。另外一个有价值的条件G因果关系例子: 单个信号源驱动两个具备不一样时间延迟的输出。双变量分析,但不是多变量分析,会错误地推断出从较短延迟输出到较长延迟输出的因果联系。
Two possible connectivities that cannot be distinguished by pairwise analysis. Adapted from Ding et al. (2006).
上述G因果公式的应用对数据作出了两个重要假设:(i)它是协方差平稳的(即每一个时间序列的均值和方差不随时间变化);(ii)它能够能够经过线性模型进行充分描述。
经过傅里叶方法,能够检查谱Spectral域中的G因果关系(Geweke,1982; Kaminski等,2001)。这对于神经生理学信号很是有用,其中频率分解一般是比较有意思的。直观地说,从X1到X2的频谱G因果关系度量了在频率f处,X2贡献给X1的分数。
为了完整性,咱们在下面给出了谱G因果关系的数学细节。 经过傅里叶变换能够获得,
矩阵A的元素为,
从新写原来的方程,
其中,
H称做为传递矩阵(transfer matrix),如今能够获得普矩阵S,
*表明矩阵的共轭转置,Σ 是残差E(t)的协方差矩阵。 从节点j到i的谱G-causality为,
其中Sii(f)是变量i在频率为f处的功率谱。 (该分析改编自(Brovelli等2004; Kaminski等2001))
Chen et al (2006)的工做指出,将Geweke提出的谱G因果关系应用于多变量(> 2)神经生理学时间序列有时会致使在某些频率处的负因果关系,这是一个有点违背(evade)物理解释的结果。他们提出了修改后的Geweke度量的条件版本,它能够经过使用分块矩阵( partition matrix)方法来克服这个问题。 Breitung和Candelon(2006)和Hosoya(1991)讨论了谱G因果关系的其余版本。
与谱G因果关系密切相关的两种方法是partial directed coherence(Baccala&Sameshima,2001)和 directed transfer function定向传递函数(Kaminski et al。2001;注意这些做者代表了定向传递函数和谱G-因果关系之间的等价性)。对于这些方法之间的比较结果,参见Baccala和Sameshima(2001),Gourevitch等人(2006)和Pereda等人(2005年)。与G因果关系的原始时域公式不一样,这些频谱测量的统计特性还没有彻底阐明。这意味着显着性检验一般依赖于替代(surrogate)数据,而且信号预处理(例如,平滑,过滤)对测量因果关系的影响仍不清楚。
G因果关系的原始公式只能给出有关信号线性特征的信息。如今已经存在对非线性状况的扩展,可是这些扩展在实践中可能更难以使用,而且他们的统计特性不太清楚。在Freiwald等人的方法中。 (1999)将全球非线性数据分为局部线性邻域(参见Chen et al.2004),而Ancona et al。 (2004)使用径向基函数方法来执行全局非线性回归。
G-因果关系的应用假定分析信号是协方差平稳的。假设非平稳信号的足够短的窗口局部平稳,能够经过使用窗口技术(Hesse et al.2003)来处理非平稳数据。一个相关的方法利用了许多神经生理学实验的试验性质(Ding等,2000)。在这种方法中,来自不一样试验的时间序列被视为具备局部平稳段的非平稳随机过程的单独实现。
关于G因果关系的全部实现的通常评论是,它们彻底依赖于适当的变量选择。显然,没有归入回归模型的因果因素不能用来表示输出。所以,G-因果关系不该被解释为直接反映物理因果链。