按部门分区、按工资求和的 Pyspark 代码,但它应该仅在第一行显示总和

问题描述 投票:0回答:1

有人可以帮我吗?

我有一个输入表,其中包含

employee_name
、部门和工资。我想添加一栏,这是工资部门的总和。但
sum_salary
应仅在该部门分区内打印在单行上。

输入表:

enter image description here

输出表:

enter image description here

结果:

enter image description here

pyspark apache-spark-sql
1个回答
0
投票

您最好使用窗口函数来求和(工资),并且在结束时您应该使用 rows Between(unboundedpreceeding, currentrow)

© www.soinside.com 2019 - 2024. All rights reserved.