在哪里可以找到 Spark 的详尽操作列表?

问题描述 投票:0回答:1

我想确切地知道在不触发 Spark RDD/DataFrame 计算的情况下我可以在 Spark 中做什么。

据我了解,只有操作才会触发转换的执行才能生成数据帧。问题是我无法找到 Spark 操作的完整列表。

Spark 文档列出了一些操作,但并不详尽。例如,show 不存在,但它被视为一个动作。

  • 在哪里可以找到完整的操作列表?
  • 我可以假设这里列出的所有方法也是操作吗?
python dataframe apache-spark pyspark
1个回答
0
投票

我认为不存在所有 Spark 操作的详尽列表。但我认为建立一个关于差异的心理模型并在需要时参考文档是有帮助的。

对于转换,单独调用该函数不会产生预期输出。只有当您调用某个操作时,Spark 才会开始计算结果。动作有以下三种

(摘自 Spark:权威指南) Excerpt from Spark: The Definitive Guide

您提供的链接列出了一些操作,但也包括其中的转换

© www.soinside.com 2019 - 2024. All rights reserved.