polars 将 array[string] 列聚合到 set[str]

问题描述投票：0回答：0

我有极地数据框：

df = pl.DataFrame({
    'col1': [["aaa", "aaa"], ["bbb", "ccc"], ["ccc", "ddd", "ddd"], ["ddd", "ddd", "ddd"]],
    'col2': ["a", "a", "a", "a"],
    'col3': ["x", "x", "y", "y"]
})

我想按 col2、col3 分组并将 col1 聚合到 Set[String]

(df
.groupby(["col2", "col3"])
.agg([pl.col("col1").flatten().apply(set).alias("result")])
)

当我在 1700 万条记录上运行它时，它的执行速度非常慢。 10 分钟后它仍然没有完成。

如何加快速度？

python set aggregate flatten polars

最新问题

我可以查看我在 GitHub Copilot 中索引了哪些存储库的列表吗？
如何获取 BigQuery 中运行的所有查询的计数
在较新的 Visual Studio 上编译 emWin 模拟
C 编程基础：为什么用 gcc 编译 .c 文件后看不到 .o 文件
ARM 的 gcc 中是否使用了分支预测？我们如何禁用它？
移植gcc而不移植Binutils？
两个不同流之间的相同负载未通过 Spring Cloud Stream 正确映射
如何使用GCC编译器以图形形式显示.cfg文件
_WIN32、__linux__...预处理器宏如何工作？
同步父子之间的状态
JDateChooser 仅在您自动选择日期一次时才会执行操作
有没有正确的方法来克隆 JavaScript 中对象的某些原始属性？
在sql中使用if-else条件选择状态
如何在 Julia 中实现（派生）异常类型？
有条件地创建当前或空可选的紧凑方法
如何在构造函数中只注入一个参数（其余为普通参数）？
如果我在 C++ 脚本中将 C 与 C++ 混合会发生什么？
Ruby Spawn 不接受 IO.pipe
Bootstrap 折叠导航栏切换按钮不起作用（角度）
桥接 React Native 的 Swift 委托

polars 将 array[string] 列聚合到 set[str]

问题描述 投票：0回答：0

最新问题

问题描述投票：0回答：0