如何在结构化流中的pyspark中使用foreach运算符(失败的'DataStreamWriter'对象没有属性'foreach')?

问题描述 投票:1回答:1

我在pyspark 2.3.4中使用结构化流。

我正在尝试使用foreach运算符,如下所示:

query = prediction.writeStream.format('console').foreach(process_row).start()

我收到以下错误:

AttributeError:“ DataStreamWriter”对象没有属性“ foreach”

这里是什么问题?

apache-spark pyspark spark-structured-streaming
1个回答
0
投票

tl; dr至少使用Spark 2.4.0。

根据official documentation运算符的foreach,它是

“ 2.4版的新功能。”

© www.soinside.com 2019 - 2024. All rights reserved.