我如何选择R-DataFrame中第三个四分位数以上的数据

问题描述 投票:-1回答:1

我想选择某些变量的值在相应的三分位数(𝑄3)以上的个案

由于我的数据集非常大,我将以R中的'空气质量'数据库为例。

df <- airquality[complete.cases(airquality),]

目标是按某些列进行过滤(“臭氧”,“ Solar.R”,“风”,“温度”)。

目前,我能够开发此解决方案:

filtro_Ozone = df$Ozone>quantile(df$Ozone)[4]
filtro_Solar.R = df$Solar.R>quantile(df$Solar.R)[4]
filtro_Wind = df$Wind>quantile(df$Wind)[4]
filtro_Temp = df$Temp>quantile(df$Temp)[4]

df[filtro_Ozone & filtro_Solar.R & filtro_Wind & filtro_Temp,]

我从中获得:

   Ozone Solar.R Wind Temp Month Day
40    71     291 13.8   90     6   9

获得此的另一种更好的方法?

r dataframe quantile
1个回答
1
投票
更新:根据OP的更新请求,您可以使用dplyr中的filter_at只过滤选定的变量:
© www.soinside.com 2019 - 2024. All rights reserved.