我开始做统计学,在我的项目中,我想找到相关系数,以便找到变量,这与时间的相关性最好.我想做的是找到一行(如 "A"),代表一个变量和(或超过)时间(列1至10)之间的相关性.因此,如何在第1行中的所有值相关的时间过程中,让我们说10天.如果我使用错误的术语,请原谅我,仍然是一个初学者。
# Dataframe
DF <- rbind(sample(1:100,10)/100, sample(1:100,10)/100, sample(1:100,1)/100)
colnames(DF) <- (1:10)
rownames(DF) <- c("A", "B", "C")
如果我会做它在excel中,它会像=CORREL(B2:G2, $B$1:$G$1),而$B$1:$G$1将是时间和B2:G2的值.我希望它清楚我试图说什么。
谢谢你的帮助
将数据集转置为长格式,然后运行以下的程序 cor()
对数据集的函数
DF2 <- t(DF)
cor(DF2)
A B C
A 1.0000000 -0.3752275 NA
B -0.3752275 1.0000000 NA
C NA NA 1
您可以简单地通过 cor(DF)
函数。如果你有非数字列,那么只需简单地排除它们。