为什么置信区间与该回归中的标准误差不一致？

Question

我正在进行线性回归，具有固定的效果，并且标准误差由某个组聚类。

 areg ref1 ref1_l1 rf1 ew1 vol_ew1 sk_ew1, a(us_id) vce(cluster us_id)

一行代码如上，输出如下：

现在，t统计量和P值看起来不一致。我们如何让t-stat> 5和pval> 11％？同样，95％的置信区间似乎比Coeff宽得多。 +-2标准错误。

我想念什么？

Answer 1

这里没有任何矛盾之处。您的样本量较小，模型较少，并且几乎没有足够的自由度。请注意，areg不会为模型发布F统计量或P值（强烈的危险信号）。您的统计数据与手工检查一致：

. display 2 * ttail(1, 5.54)
.11368912

. display 2 * ttail(1, 113.1)
.00562868

简而言之，这里没有错误，也没有编程问题。这只是您的模型过度拟合数据及其副作用的问题。

类似地，根据经验，在95％的置信区间内，+ /-2 SE距离很远。同样，手计算很有启发性：

. display invt(1, 0.975)
12.706205

. display invt(60, 0.975)
2.0002978

. display invt(61, 0.975)
1.9996236

. display invnormal(0.975)
1.959964