我将
pd.cut
与关键字参数 duplicates='drop'
一起使用。但是,当您将其与关键字参数 labels
结合使用时,这会产生错误。
这个问题与this问题类似,但忽略了标签部分。
不起作用:
pd.cut(pd.Series([0, 1, 2, 3, 4, 5]), bins=[0, 1, 1, 2])
作品:
pd.cut(pd.Series([0, 1, 2, 3, 4, 5]), bins=[0, 1, 1, 2], duplicates='drop')
不起作用:
pd.cut(pd.Series([0, 1, 2, 3, 4, 5]), bins=[0, 1, 1, 2], duplicates='drop', labels=[0, 1, 1, 2])
我们难道不希望它删除与重复条目对应的标签吗?
cut
文档非常清楚,它只涉及bins:
重复 {默认‘raise’, ‘drop’},可选
如果 bin 边不唯一,则引发 ValueError 或丢弃非唯一值。
此外,在任何情况下,标签都必须比 bin 多一个值,因此根据 bin 删除标签将是不明确的。