将列附加到pyspark数据框中的数组中

问题描述 投票:0回答:1

我有一个包含2列的数据框

| VPN    | UPC             |
+--------+-----------------+
| 1      | [4,2]           |
| 2      | [1,2]           |
| null   | [4,7]           |

我需要一个结果列,其中将vpn(字符串)的值附加到数组UPC。结果如下所示。

| result |
+--------+
| [4,2,1]|
| [1,2,2]|
| [4,7,] |
arrays apache-spark pyspark append pyspark-dataframes
1个回答
0
投票

一个选项是使用concat + concat。首先使用arrayarray列转换为数组类型,然后使用array方法将两个数组列连接起来:

VPN
© www.soinside.com 2019 - 2024. All rights reserved.