import polars as pl
...
# Sort by date, then pick the first row for each UID (earliest date)
sample_frame=sample_frame.sort(by=DATE_COL).unique(subset=UID_COL, keep='first')
我希望上述操作后的结果帧按日期顺序排序,但似乎并非如此。
那么重复数据删除操作是否也会打乱剩余行的顺序?在调用
unique
后,Polars 文档或其维护者是否对行排序提供任何保证?
您可以使用
maintain_order
方法的
unique()
参数:
sample_frame = (
sample_frame
.sort(by=DATE_COL)
.unique(subset=UID_COL, keep='first', maintain_order=True)
)