Gls
一、异方差检验
截面数据,关注对角线元素
时间系列数据,关注非对角线元素
放开第四个条件(同方差假设) OLS估计,会出现,系数无偏性不变,方差和分布发生变化 ,所以ols是偏的,但不是最有效性,因为方差和协方差发生变化。
作模型作变换,两边同时除以xi,让它符合ols条件。
Fgls:
Var(ε)=α2∑
当∑不知道,执行ols估计,估计∑中的未知参数,得到估计的∑,利用第一步的∑进行gls估计。
1、图形分析:
残差对预测值图rvfplot, yline(0) ms(d) msize(small)
残差对某变量图rvpplot ttl_exp, ms(d) msize(small)
2、B-P分析
原理:干扰项的方差【sigma_i^2】是一个常数乘经线性式子,异方差是由这个线性组合引起的
sigma_i^2 = sigma^2*(a0 + a1*z1 + a2*z2 + ...)
sigma_i^2:用残差的平方替代干扰项方差
sigma^2:用残差平方的平均替代。
* H0: a1=a2=...=0:如果没有异方差
* 检验思路:用 ei^2/avg(ei^2) 对一系列可能导致异方差的变量作回归
* LM= 0.5*MSS -- chi2(k) (k 为解释变量的个数,不包括常数项)
用处理后残差[残差的平方除以残差平方的平均值]对预测回归,然后0.5*e(mss)
命令:
estat hettest,normal用被解释变量的预测值对干扰项回归
Estat,rhs 对所有变量检验,用所有变量对干扰项回归
Estat turn trunk 对turn trunk两个变更检验,用这两个变量对干扰项回归
Estat turn trunk,rhs 对两个变量+所有参悟回归变量检验检验,用这些所有变量对干扰项检验
原理:残差的平方对预测值回归,用回归观测值个数*R-平方
命令:estat hettest ,iid
3、秩检验
原理:如果不存在异方差,那么残差平方和,与用秩作权重的残差平方和基本相等。
D = (sum of h*e2) / (sum of e2)
命令:estat szroeter, rhs
4、G-Q检验
* 思路:
* 1. 根据某一变量对样本排序;
* 2. 去掉中间的 r 个观察值
* 3. 分别对前后 n1 和 n2 个样本进行回归;
* 4. 计算 R = (S2/n1-k)/(S1/n2-k) S 为残差平方和
* 5. 在原假设下, R--F(N1-K, N2-K)
5、white 检验
思路
* 用ols估计异方差模型,真实的估计量方差,Var(b) =
sigma^2*inv(X'X)*X'QX*inv(X'X)
* 原假设:同方差:Q = I ,如果原假设没有被拒绝,那么Var(b) = sigma^2*inv(X'X)与上式没有明显差别。
* reg e2 对所有的解释变量和它们的交乘项即平方项,X'QX会产生解释变量平方项,交乘项。
* W = N*R2 -- chi2(K-1) K 为解释变量的个数,包含常数项
命令:
estat imtest, white /*方法1:stata内部命令*/
whitetst /*方法2:外部命令*/
6、 Glesjer's test
* 三种可能的异方差形式:
* (a) Var[ei] = sigma^2*[b0 + b1*z1 + b2*z2 + ...]
* (b) Var[ei] = sigma^2*[b0 + b1*z1 + b2*z2 + ...]^2
* (c) Var[ei] = sigma^2*exp[b0 + b1*z1 + b2*z2 + ...]
用干扰项的方差,这里用残差平方代替,相应形式对解释变量回归,取回归后F值。
7、检验组间异方差
用残差对相应的解释变量分析,
sysuse nlsw88, clear
reg wage ttl_exp race age industry hours
predict e, res
robvar e, by(occupation) /*stata内部命令*/
gwhet e, i(occupation) /*findit gwhet, plus文件夹*/
gwhet e, i(race)
二、估计
1、white稳健估计
真实的 Var(b) = inv(X'X)*(X'QX)*inv(X'X)
White发现我们没有必要估计Q,而是估计x’Qx就可以的。Q中α2可以用残差平方代替。
命令,robust
2、gls估计
Q已知,加一个权重,让波动大的样本占比例小些。相当每一个观测值除以一个数,然后再ols估计
3、fgls
Q未知
*== 手动计算
* step1:利用残差估计出 Q 中的参数,得到 Q_hat;
* step2: 利用 Q_hat 执行 GLS 估计
先回归,得到残差,计算残差平方,用残差平方对有关变量回归,再根据回归后的结果预测残差平方拟合值—得到Q_hat,用残差平方预测作权重回归。
* 假设:sigma_i^2 = sigma^2*(a1*income + a2*income2)
qui reg expend age ownrent income income2
predict e , res
gen e2 = e^2
qui reg e2 income income2, noconstant
qui predict p1
reg expend age ownrent income income2 [aweight=1/p1]
* 假设:sigma_i^2 = sigma^2*exp(a0 + a1*ln_income)
gen ln_e2 = ln(e^2)
gen ln_income = ln(income)
qui reg ln_e2 ln_income
predict p2
replace p2 = exp(p2)
reg expend age ownrent income income2 [aweight=1/p2]
使用命令,wlso
4、组间异方差
用标准化的残差平方作为权重。
序列相关
干扰项相关,
如,AR(1): u_t = rho*u_t-1 + v_t, v_t --i.i.d N(0,sigma^2)
此时,Q = Var[U] 会有新的形式
关注非对角线元素
第五讲 最大似然法 MLE(大样本进行分析)
Ols, gmm ,Mle三者是平行分析工具。
原理:事先假设干扰项或被解释变量的分布,找到一个目标函数(密度函数),使分布各自取得概率联合起来最大。进而求解目标函数,得到统计量。
(求最大值用数值算法)
* -- 选择合适的最大化方法 -- technique()选项
* technique(nr) Newton-Raphson (default)
* technique(bhhh) Berndt,Hall,Hall,Hausman(1974)
* technique(dfp) Davidon,Fletcher,Powell
* technique(bfgs) Broyen,Fletcher,Goldfarb,Shanno
收敛定义:两次迭代之差小于e^-7,
*================
* MLE 的基本步骤
*================
* 1. 推导最大似然函数
* 2. 编写似然函数的stata程序(可选:似然函数的一阶和二阶导数)
* 3. 设定解释变量和被解释变量,完整设定:ml model 命令
* 4. 估计最大似然函数:ml maximize 命令
*---------------------------------------------------------------*方程保存的名称要与定义中名称一样,扩展名为’.ado’
cap program drop mymean_lf
program define mymean_lf
version 9.1 /*声明Stata版本*/
args lnf mu sigma /*输入项:似然函数,参数1,参数2,……*/
quietly replace `lnf' = ln(normalden($ML_y1, `mu', `sigma'))
/*$ML_y1 默认写法,表示被解释变量*/
end
*---------------------------------------------------------------*
*-----------------
* 结构型VAR模型:反映同期因果关系
*-----------------
* -- 简介
* 缩减型VAR模型只能描述各个内生变量 y_t 的动态形成过程;
* 着重的是内生变量的“跨期”相关性,:内生变量各自滞后项以及其他内生变量滞后项对各自影响。
* 并不考虑内生变量的“同期”相关性,:同期因素关系
* 因此无法呈现内生变量之间的“因果关系”
* 而采用结构型VAR模型(SVAR),则可以根据相关理论设定变量之间的因果关系
* 模型设定:
* p
* A*y_t = SUM A_j*y[t-j] + e_t (1)A反映同期相关
* j=1
*
* Var(e_t) = Sigma = B*B' (正交分解,B 是一个下三角矩阵)
*
* 设 e_t = B*u_t (u_t 称为“正交单位创元”) (2)
*
* Var(u_t) = I_t(单位矩阵),u_t 是一个向量
*
* (1) 式可改写为:
*
* p
* A*y_t = SUM A_j*y[t-j] + B*u_t (3)
* j=1
*
* 设 Var(v_t) = S, 即,v_t -- N(0, S),
* 其中,v_t = A^{-1}*e_t, 即(1)式对应的缩减型VAR模型的干扰项;
*
* 由于 S 为正定矩阵,所以可进行裘氏分解如下: S = P*P'
* 由 (3) 式可得:P = A^{-1}*B
* 因此,根据 VAR 估计得到的残差的方差-协方差矩阵 S,我们可以进而得到 A 和 B
*-- 为了使模型能够确认:
* (1) A 是一个下三角矩阵,B 是一个对角矩阵
* (2) 通常将 A 矩阵的对角元素设定为 1,
* (3) A 矩阵的非对角元素反映了变量间的“同期”因果关系
*-- 对 SVAR 的解释:
* (1) A 的系数反映了各个内生变量的同期关系,即因果关系;
* (2) B 的系数反映了来自不同内生变量的随机干扰对系统的影响,
* 因此,我们事实上对干扰项 e_t 进行了正交分解,得到了“单位正交创元”u_t,
* 这使得我们可以分析 u_t 变化一单位对系统的动态影响。
* 例1-- 短期恰足确认结构型VAR模型(short-run just-identified SVAR model)
* 所谓“短期”,是指通过对 A 矩阵施加约束条件,来反映变量间的“同期”因果关系
* 所谓“长期”,是指通过对 C = A^{-1}*B 施加约束,来反映变量间的长期交互影响
* 模型 y_t = (dlinvestment, dlincome, dlcosumption)'
* 设
* | 1 0 0 | | . 0 0 |
* A = | . 1 0 | B = | 0 . 0 |
* | . . 1 | | 0 0 . |
* 含义:
* (1) 当期投资(invest)不受收入(income)和消费(consumption)的影响
* (2) 收入(income)受当期投资(invest)的影响,但不受当期消费(consumption)的影响
* (3) 消费(consumption)同时受到当期投资(invest)和收入(income)的影响
因篇幅问题不能全部显示,请点此查看更多更全内容