我想在两列中保持离群值,在四分位数之上和之下。数据框本身有10列。下面是我的代码。但是代码的最后一行返回KeyError: 0.99
。
outliers_cols = df[['ColA', 'ColB']]
low = 0.01
high = 0.99
qtldf = outliers_cols.quantile([low, high])
outliers_df = df[(outliers_cols > qtldf[high]) | (outliers_cols < qtldf[low])]
感谢您的帮助。
您正在尝试将索引错误地索引到qtldf
数据框中。使用loc
代替:
qtldf.loc[high]