使用分位数在多列中进行异常检测将返回错误

问题描述 投票:0回答:1

我想在两列中保持离群值,在四分位数之上和之下。数据框本身有10列。下面是我的代码。但是代码的最后一行返回KeyError: 0.99

outliers_cols = df[['ColA', 'ColB']]

low = 0.01
high = 0.99
qtldf = outliers_cols.quantile([low, high])

outliers_df = df[(outliers_cols > qtldf[high]) | (outliers_cols < qtldf[low])]

感谢您的帮助。

python quantile
1个回答
0
投票

您正在尝试将索引错误地索引到qtldf数据框中。使用loc代替:

qtldf.loc[high]
© www.soinside.com 2019 - 2024. All rights reserved.