看到这个问题,刚好本人最近的论文使用了ADF检验这个方法,前段时间研究了整个ADF检验的流程,对其有较深刻的理性认识。
通俗来讲,在一般情况下,ADF检验主要用于时间序列数据,这是因为时间序列会存在不平稳的过程,不平稳的时间序列数据可能会带来t检验失败、自回归系数估计值有偏向的等问题,最后使用stata对数据跑回归可能是一个伪回归或者伪相关,因此得出来的回归结果就是不大可靠的。
在ADF检验当中比较重要的一个环节就是看滞后阶数是否显著(lags几期)之后回归。接下来讲一下stata操作流程:
首先,进行不带趋势项的DF检验,命令为dfuller lny(假如lny是经济产出变量),看DF统计量大不大于左边单侧检验,若小于,则可以拒绝“存在单位很”的原假设。
接着输入“dfuller lny,lags(xx)reg ”,其中,xx可以是任何数字,用于检测最优滞后阶数,如果Z值一直不显著,可以使用PP检验,命令为:pperron lny。
如果PP检验还是不显著........那就用最有功效的DF-GLS检验,命令为:“dfgls lny” ,此时stata会给你一个表格,该表会显示数据在几阶的1%、5%、10%显不显著,这个时候再不显著,就证明该时间序列存在单位根。
发现数据存在单位根之后我们要将原假设变为平稳序列,这个时候要进行KPSS检验,命令为:“kpss lny,nottrend”。
接着stata会告诉你数据从几阶到几阶滞后,如果统计量均大于5%置信水平的统计值,则认为存在单位根,因此,进一步检验lny的差分是否平稳,命令为:dfgls dlny,如果表格显示滞后阶数介于几到几之间,那这个时候就可以拒绝原假设了,即认为差分dlny为平稳过程。
之后再进行kpss检验,命令为:“kpss dlny,nottrend ”。
这个时候,我们就可以看到统计量均远小于5%的临界值,接受平稳过程的原假设,在最后填写ADF检验结果表格的时候就可以写上:“接受lny 为a阶单整a(x)过程。”
然后上述过程对每个时间序列变量都进行一遍。
在最后的结果表格写上:“ADF统计值、5%临界值、P值、平稳与否。”
在进行kpss检验之后为几阶单整过程即可。(如果理解不了其中的数学逻辑可以先上软件操作,论文中不需要太多的理论推导,上结果分析回归结果即可,答辩的时候再准备理论推导)
参考资料:陈强.高级计量经济学及stata应用[M].高等教育出版社.2010(414-422)