面板数据(Panel Data)是将“截面数据”和“时间序列数据”综合起来的一种数据类型。具备“横截面”和“时间序列”两个维度,当这类数据按两个维度进行排列时,数据都排在一个平面上,与排在一条线上的一维数据有着明显的不一样,整个表格像是一个面板,因此称为面板数据(Panel Data)。
实际上若是从数据结构内在含义上,应该把Panel Data称为“时间序列-截面数据”,更能体现数据结构本质上的特色。该数据为也被称为“纵向数据(Longitudinal Data)”,“平行数据”,“TS-CS数据(Time Series-Cross Section)”。它是截面上个体在不一样时间点的重复测量数据。面板数据从横截面(cross section)看,是由若干个体(entity,unit,individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每一个个体都是一个时间序列。
从时空维度来看,可将计量经济学中应用的数据分三类:
一、横截面数据(Cross-sectional data)
横截面数据是指在某一时点收集的不一样对象的数据。它对应同一时点上不一样空间(对象)所组成的一维数据集合,研究的是某一时点上的某种经济现象,突出空间(对象)的差别。横截面数据的突出特色就是离散性高。横截面数据体现的是个体的个性,突出个体的差别,一般横截面数据表现的是无规律的而非真正的随机变化。即计量经济学中所谓的“没法观测的异质性”。在分析横截面数据时,应主要注意两个问题:一是异方差问题,因为数据是在某一时期对个体或地域的样本的采集,不一样个体或地域自己就存在差别;二是数据的一致性,主要包括变量的样本容量是否一致、样本的取样时期是否一致、数据的统计标准是否一致。
二、时间序列数据(Time-series data)
时间序列数据是指对同一对象在不一样时间连续观察所取得的数据。它着眼于研究对象在时间顺序上的变化,寻找空间(对象)历时发展的规律。利用时间序列做样本时,要注意几个问题:一是所选择的样本区间内经济行为的一致性问题;二是样本数据在不一样样本点之间不可比,须要对原始数据进行调整,消除其不可比因素;三是样本观测值过于集中,于是时间序列数据不适宜于对模型中反映长期变化关系的结构参数的估计;四是模型随机偏差的序列相关问题。
三、纵向数据(Longitudinal data)或面板数据(Panel data)
面板数据,即Panel Data,是截面数据与时间序列综合起来的一种数据资源。 在分析时,多用PanelData模型,故也被称为面板数据模型. 它能够用于分析各样本在时间序列上组成的数据的特征,它可以综合利用样本信息,经过模型中的参数,既能够分析个体之间的差别状况,又能够描述个体的动态变化特征。
举栗一个,栗子来源于网络!
时间序列数据:北京一年来天天的平均温度。
截面数据:北京,上海,深圳,广州某一天的平均温度。
面板数据:北京,上海,深圳,广州这一年来天天的平均温度。
适用范围:
时间序列数据:某一个个体随时间变化产生的数据。
截面数据:许多个个体在同一个时间下因为个体不一样而产生的数据。
面板数据:前两个的综合——许多个个体因为个体不一样以及时间变化产生的数据。
分析方法:
时间序列数据:主要围绕时间变化,可看整体趋势,季节性,周期性,ARIMA(自回归,滑动平均,差分)等。
截面数据:主要围绕统计个体区别,可用线性回归,主元分析等。 面板数据:前两个的综合。
举栗二个,栗子来源于网络!
如:城市名:北京、上海、重庆、天津的GDP分别为十、十一、九、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不一样就是截面数据。
如:2000、200一、200二、200三、2004各年的北京市GDP分别为八、九、十、十一、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不一样就是时间序列。
如:2000、200一、200二、200三、2004各年中国全部直辖市的GDP分别为:
北京市分别为八、九、十、十一、12;
上海市分别为九、十、十一、十二、13;
天津市分别为五、六、七、八、9;
重庆市分别为七、八、九、十、11(单位亿元)。
这就是面板数据。
git