我正在进行线性回归,具有固定的效果,并且标准误差由某个组聚类。
areg ref1 ref1_l1 rf1 ew1 vol_ew1 sk_ew1, a(us_id) vce(cluster us_id)
现在,t统计量和P值看起来不一致。我们如何让t-stat> 5和pval> 11%?同样,95%的置信区间似乎比Coeff宽得多。 +-2标准错误。
我想念什么?
这里没有任何矛盾之处。您的样本量较小,模型较少,并且几乎没有足够的自由度。请注意,areg
不会为模型发布F统计量或P值(强烈的危险信号)。您的统计数据与手工检查一致:
. display 2 * ttail(1, 5.54)
.11368912
. display 2 * ttail(1, 113.1)
.00562868
简而言之,这里没有错误,也没有编程问题。这只是您的模型过度拟合数据及其副作用的问题。
类似地,根据经验,在95%的置信区间内,+ /-2 SE距离很远。同样,手计算很有启发性:
. display invt(1, 0.975)
12.706205
. display invt(60, 0.975)
2.0002978
. display invt(61, 0.975)
1.9996236
. display invnormal(0.975)
1.959964