我想选择某些变量的值在相应的三分位数(𝑄3)以上的个案
由于我的数据集非常大,我将以R中的'空气质量'数据库为例。
df <- airquality[complete.cases(airquality),]
目标是按某些列进行过滤(“臭氧”,“ Solar.R”,“风”,“温度”)。
目前,我能够开发此解决方案:
filtro_Ozone = df$Ozone>quantile(df$Ozone)[4]
filtro_Solar.R = df$Solar.R>quantile(df$Solar.R)[4]
filtro_Wind = df$Wind>quantile(df$Wind)[4]
filtro_Temp = df$Temp>quantile(df$Temp)[4]
df[filtro_Ozone & filtro_Solar.R & filtro_Wind & filtro_Temp,]
我从中获得:
Ozone Solar.R Wind Temp Month Day
40 71 291 13.8 90 6 9
获得此的另一种更好的方法?