我有显示统计数据的代码:
data = data.assign(
ArrDelay=np.where(data["ArrDelay"].lt(0), 0, data["ArrDelay"]),
DepDelay=np.where(data["DepDelay"].lt(0), 0, data["DepDelay"])
)
data[["ArrDelay", "DepDelay"]].head(40)
data['Month'] = (data['ArrDelay'] + data['DepDelay'])
result = data.groupby("UniqueCarrier")["Month"].mean()
print(result)
sns.boxplot(x='UniqueCarrier', y='Month', data=data, order=result.index)
但箱线图不正确。
这是我的结果:
我希望它是这样的:
您应该使用
showfliers
选项删除异常值:
#...
sns.boxplot(
x = "UniqueCarrier",
y = "Month",
data = data,
order = result.index,
showfliers = False
)