MAP 估计值不应该接近迹线样本直方图的中心吗?
在对模拟数据进行建模时,我发现 find_MAP 估计值与跟踪变量的直方图之间非常一致。但我发现与真实数据存在巨大差异。所有分布似乎都是单峰的,并且采样中不存在分歧。我知道它们不必相同,但该模型中的其他所有内容都表现良好,只是跟踪样本似乎有所偏移。也许是样本标准差的 2 倍。
我建立了一个模型,将越野跑步者的时间与个人跑步者的能力和路线难度联系起来。还有一些线性因素可以解释跑步者逐年、逐月在赛季中所看到的进步。我有很多数据。显然,现实世界比我的模拟数据更混乱。
我无法分享数据,但模拟数据和模型在Github上。
我可以做什么来调试这个模型(和真实数据)?除一个参数(常数项)外,r_hat 均小于 1.1。其他数字看起来可疑吗?
我很困惑。感谢您的任何建议。
--马尔科姆
mean sd hdi_3% hdi_97% mcse_mean mcse_sd ess_bulk ess_tail r_hat
bias 393.221 9.591 378.139 411.427 3.885 2.908 8.0 49.0 1.20
monthly_slope -7.383 0.536 -8.434 -6.440 0.037 0.027 214.0 1150.0 1.01
yearly_slope -6.370 0.518 -7.323 -5.361 0.043 0.031 147.0 726.0 1.02
course_est[0] 1.521 0.074 1.379 1.653 0.019 0.014 15.0 115.0 1.09
course_est[1] 1.403 0.052 1.316 1.507 0.019 0.014 8.0 80.0 1.19
... ... ... ... ... ... ... ... ... ...
runner_est[1936] 1.583 0.088 1.409 1.738 0.003 0.002 981.0 1434.0 1.01
runner_est[1937] 1.616 0.041 1.539 1.692 0.008 0.006 25.0 505.0 1.05
runner_est[1938] 1.546 0.030 1.488 1.600 0.008 0.006 16.0 95.0 1.08
runner_est[1939] 1.790 0.094 1.604 1.954 0.005 0.003 400.0 1196.0 1.01
eps 5.394 0.045 5.313 5.480 0.001 0.001 1498.0 1457.0 1.00
2270 rows × 9 columns
这是部分答案。不要相信点估计,例如 MAP。
https://discourse.pymc.io/t/how-to-reference-posterior-mode-value-without-find-map/3632