我正在分析包含分类值和数值的数据集。我想检测分类值列和数值列之间的依赖性。我遇到过一个建议,建议用户使用线性模型的 r 因子,并将其解释为 R 平方。然而,将 R 平方应用到我的数据后,结果没有任何意义。
你们中有人使用 r 因子以外的任何其他方法进行过此类分析吗?
corr_matrix = np.corrcoef(data.x, data.y)
corr = corr_matrix[0,1]
R_sq = corr**2
print(R_sq)
你可以尝试- 学生 T 检验 方差分析 逻辑回归 根据您的用例