我有一个包含 48 列和 481 行的大型数据集。我需要计算每 12 行中每列的平均值。因此单元格 [12,1] [24,1] 等,然后再次针对第 2 列。 当时我还没有找到一种简单的方法来处理超过 5 行的内容
这就是我以前的做法,这不是最佳方法,但我一生都找不到更好的方法。
# getting the mean of every 96th row (5 rows), then plotting it, and repeat for every column
# modified_c... is the df
for (l in 1:47){
A = (as.numeric(modified_Candida_albicans_5plates_48h[row,column]))
row = row + 96
B = (as.numeric(modified_Candida_albicans_5plates_48h[row,column]))
row = row + 96
C = (as.numeric(modified_Candida_albicans_5plates_48h[row,column]))
row = row + 96
D = (as.numeric(modified_Candida_albicans_5plates_48h[row,column]))
row = row + 96
E = (as.numeric(modified_Candida_albicans_5plates_48h[row,column]))
meana = c(A,B,C,D,E)
meanb = mean(meana)
points(time,meanb,pch = 19, col="blue")
time = time + 1
column = column + 1
row = row - 384
}
如果您的数据框名为
df
,请使用
colMeans(df[seq(0, nrow(df), 12),])
说明:
df[seq(0, nrow(df), 12),]
获取由第 12、24、36、... 行组成的子集colMeans()
计算每列的平均值。