是否可以使用IntelliJ中的Scala工作表作为Jupyter笔记本的替代品。我按照here提到的解决方案,但是它在本地运行代码而不是在远程集群上运行。我的主要挑战是IntelliJ IDE在我的笔记本电脑中本地运行,而火花集群在云端。如何让IntelliJ使用远程SBT?
如果您只是以更具互动性/特殊性的方式尝试教程来学习Spark编程和概念,那么您在帖子中提到的链接就是您将如何做到的。在该模式中,您基本上模拟单节点Spark集群(即本地计算机),它既充当驱动程序又充当执行程序节点(一体化)。
但是,在更真实的场景中,这并不是您在ACTUAL Spark群集上实际提交和运行Spark应用程序的方式。如果您正在尝试这样做,则需要使用Spark提供的两种部署模式之一:客户端模式和群集模式。您将使用“spark-submit”命令行实用程序将已编译的Spark库(胖JAR)作为Spark作业提交。更多细节here。