MAP 估计与后验平均值不一致

问题描述 投票:0回答:1

MAP 估计值不应该接近迹线样本直方图的中心吗?

在对模拟数据进行建模时,我发现 find_MAP 估计值与跟踪变量的直方图之间非常一致。但我发现与真实数据存在巨大差异。所有分布似乎都是单峰的,并且采样中不存在分歧。我知道它们不必相同,但该模型中的其他所有内容都表现良好,只是跟踪样本似乎有所偏移。也许是样本标准差的 2 倍。

我建立了一个模型,将越野跑步者的时间与个人跑步者的能力和路线难度联系起来。还有一些线性因素可以解释跑步者逐年、逐月在赛季中所看到的进步。我有很多数据。显然,现实世界比我的模拟数据更混乱。

我无法分享数据,但模拟数据和模型在Github上。

我可以做什么来调试这个模型(和真实数据)?除一个参数(常数项)外,r_hat 均小于 1.1。其他数字看起来可疑吗?

我很困惑。感谢您的任何建议。

--马尔科姆

                mean    sd    hdi_3%    hdi_97% mcse_mean   mcse_sd ess_bulk    ess_tail    r_hat
bias           393.221  9.591   378.139 411.427 3.885   2.908   8.0 49.0    1.20
monthly_slope   -7.383  0.536   -8.434  -6.440  0.037   0.027   214.0   1150.0  1.01
yearly_slope    -6.370  0.518   -7.323  -5.361  0.043   0.031   147.0   726.0   1.02
course_est[0]   1.521   0.074   1.379   1.653   0.019   0.014   15.0    115.0   1.09
course_est[1]   1.403   0.052   1.316   1.507   0.019   0.014   8.0 80.0    1.19
... ... ... ... ... ... ... ... ... ...
runner_est[1936]    1.583   0.088   1.409   1.738   0.003   0.002   981.0   1434.0  1.01
runner_est[1937]    1.616   0.041   1.539   1.692   0.008   0.006   25.0    505.0   1.05
runner_est[1938]    1.546   0.030   1.488   1.600   0.008   0.006   16.0    95.0    1.08
runner_est[1939]    1.790   0.094   1.604   1.954   0.005   0.003   400.0   1196.0  1.01
eps 5.394   0.045   5.313   5.480   0.001   0.001   1498.0  1457.0  1.00
2270 rows × 9 columns
pymc3 pymc
1个回答
0
投票

这是部分答案。不要相信点估计,例如 MAP。

https://discourse.pymc.io/t/how-to-reference-posterior-mode-value-without-find-map/3632

© www.soinside.com 2019 - 2024. All rights reserved.