重复调用带有_列的极坐标会导致碎片吗?

问题描述 投票:0回答:1

在极地多次呼叫

with_columns
会受到惩罚吗?它会导致数据框“碎片化”吗?

编辑:我并不是想用“碎片化”这个词来分散注意力。我真正的问题是,多次调用

with_columns
而不是调用很多列的
with_columns
是否会造成性能损失?

python-polars rust-polars
1个回答
2
投票

我不这么认为。这在 Pandas 中不好的原因是它可以触发BlockManager内的整合。如果您要插入 N 列,由于重复复制块,合并可能会导致花费 O(N^2) 时间。

Polars 缺乏与 BlockManager 相当的功能。我不相信在任何情况下它都会在同一个支持 Arrow 数组中存储两列。

© www.soinside.com 2019 - 2024. All rights reserved.