我有任务需要用 python 完成。描述如下:
使用函数
,基于变量scipy.stats.bootstrap()
:皮尔逊相关系数,在显着性水平1-alpha = 0.98
下对以下参数进行区间估计。sample_2
将结果保存到名为
的变量中,其中包含带有置信区间下限和上限的列表。计算各参数值时,将随机数生成器种子对应的r_ci
中函数参数的值设置为scipy.stats.bootstrap()
。25
我的代码有问题,我尝试了很多方法。所以基本上我不知道如何在引导程序中使用皮尔逊相关性。我尝试定义一个函数,或者如您所见,我尝试直接在参数中使用它。目前的问题是
x
和 y
的大小不同。这不是真的,它们都有 25 行,没有 NaN。我尝试了很多建议,但有不同的错误,但原因相同。这段代码应该非常简短,它需要遵循我之前给出的任务,并且没有任何改变sample_2
。
x = sp.stats.uniform.rvs(loc=-2, scale=10, size=25, random_state=34)
y = 2*x - 5 + sp.stats.norm.rvs(loc=0, scale=2, size=25, random_state=13)
sample_2 = pd.DataFrame(data=np.array([x, y]).T, columns=["X", "Y"])
boot_strap = sp.stats.bootstrap((sample_2['X'], sample_2['Y']), sp.stats.pearsonr, confidence_level=0.98, random_state=25)
r_ci = [boot_strap.confidence_interval[0], boot_strap.confidence_interval[1]]
print(r_ci)
好吧,解决方案就是使用一个参数:paired=TRUE