'DataStreamWriter'对象没有属性'foreach'-pyspark

问题描述 投票:0回答:1

我正在pyspark中使用结构化流进行情感分析。我正在尝试将我的预测显示为:

def process_row(row):
   ....

query1 = prediction.writeStream.outputMode("update").format('console').foreach(process_row).start()

query1.awaitTermination()

我收到以下(无意义)错误:AttributeError:'DataStreamWriter'对象没有属性'foreach'

预测模式为:

root
 |-- prediction: double (nullable = false)
 |-- count: long (nullable = false)

这里是什么问题?

foreach pyspark spark-structured-streaming
1个回答
0
投票

tl; dr至少使用Spark 2.4.0。

根据official documentation运算符的foreach,它是“ 2.4版的新功能。”

© www.soinside.com 2019 - 2024. All rights reserved.