我需要将多个过滤器应用于同一数据集并将其传递给KAFKA。
Dataset<Row> mainData=df.select( "data.*").filter("data.eventdesc='logout'");
mainData=df.select( "data.*").filter("data.eventdesc='login'");
在这种情况下,只有最后一个表达式起作用。 关于如何在两个条件下过滤数据并发送到kafka的任何建议?
基于this
答案。
Dataset<Row> mainData=df.select( "data.*").filter("data.eventdesc='logout' or data.eventdesc='login'")