我得到了两组数据,我需要弄清楚它们是否“相同”。每个数据集都包含一个 PDF 和一个 CDF(但不包括底层样本)。 PDF 和 CDF 数据采用 x、y 值的形式,它们是连续数据的数字化样本。我不知道底层分布是什么(我不知道底层分布是 beta 还是对数正态分布等) 我的数据看起来像:
第 1 组:
第二组:
重要的是:
显然,我想到了 Kolmogorov-Smirnov 检验,但我的阅读表明该检验取决于 x 轴上“排列”的 CDF 值,这不是我这里的情况。我想过将我的数据集插值到相同的 x 轴,但我担心这会引入拟合错误。
我查看了其他非参数测试,但似乎到处都是同样的问题,因为 x 值不对齐。
是否有不依赖于相同时间间隔采样的 CDF/PDF 数据的非参数检验?
使用两个样本 Kolmogorov-Smirnov 检验并对未对齐的 x 值进行插值。根据维基百科,样本数量可以不同,插值应该只保留 CDF 的左值,因为它是样本数量小于值 x 的样本数量(这在 one-sample 中指定) Kolmogorov-Smirnov 统计 文章中的部分)