我在pyspark 2.3.4中使用结构化流。
我正在尝试使用foreach运算符,如下所示:
foreach
query = prediction.writeStream.format('console').foreach(process_row).start()
我收到以下错误:
AttributeError:“ DataStreamWriter”对象没有属性“ foreach”
这里是什么问题?
tl; dr至少使用Spark 2.4.0。
“ 2.4版的新功能。”