Polars 在对列进行重复数据删除后是否能保证维持秩序?

问题描述 投票:0回答:1
代码
import polars as pl
...
# Sort by date, then pick the first row for each UID (earliest date)
sample_frame=sample_frame.sort(by=DATE_COL).unique(subset=UID_COL, keep='first')
问题

我希望上述操作后的结果帧按日期顺序排序,但似乎并非如此。

那么重复数据删除操作是否也会打乱剩余行的顺序?在调用

unique
后,Polars 文档或其维护者是否对行排序提供任何保证?

python sorting duplicates python-polars
1个回答
0
投票

您可以使用

maintain_order
 方法的 
unique()
参数:

sample_frame = (
    sample_frame
    .sort(by=DATE_COL)
    .unique(subset=UID_COL, keep='first', maintain_order=True)
)

© www.soinside.com 2019 - 2024. All rights reserved.