可能是一个非常愚蠢的问题,但针对:
val ds3 = ds.groupBy($"ip")
.avg("humidity")
尚不清楚如何为数据集而不是数据框,如何像使用别名一样即时重命名列。我尝试了几件事,但无济于事。尝试时没有错误,但没有效果。
我想要“ avg_humidity”作为列名。
扩展问题,如果我发出该怎么办:
val ds3 = ds.groupBy($"ip")
.avg()
如何处理?
[avg
不提供别名功能,您可能需要额外的withColumnRenamed
val ds3 = ds.groupBy($"ip")
.avg("humidity")
.withColumnRenamed("avg(humidity)","avg_humidity")
相反,您可以使用.agg(avg("humidity").as("avg_humidity"))
val ds3 = ds.groupBy($"ip").agg(avg("humidity").as("avg_humidity"))