我有两个分布,大小分别为 ~120 和 ~86.000 个元素。我想检查两个分布的平均值是否显着不同。
我发现我可以使用 Welch 的 t 检验来实现这一点,但该检验仍然要求分布呈正态分布。
我用
scipy.stats.normaltest()
来检查它们是否是正态分布,但测试失败了。然而,我读到,对于大样本量,测试几乎总是会失败,并且分布不必完全正态。
如何检查我的分布是否足以进行韦尔奇 t 检验,或者除了 t 检验之外还有其他方法可以用来确定两个分布的平均值是否显着不同?
以下是有问题的分布:
您可以尝试使用曼-惠特尼 U 检验。它可以应用于非正态分布(它是非参数检验)。但是,它确实做出了一些假设,您需要检查:
scipy.stats.mannwhitneyu
。