SparkSession | Ubuntu |爆燃不起作用

问题描述 投票:0回答:1

我正在尝试使用PyCharm而不是jupyter笔记本在Ubuntu上本地使用PySpark来构建Electron应用程序。但是,当我尝试设置SparkSession时,它不起作用。当我尝试这个:

spark = SparkSession.builder.master('local[*]').appName('Search').enableHiveSupport().getOrCreate
df = pd.DataFrame([1,2,3], columns=['Test'])
myschema = StructType([StructField('Test'),Integertype(),True)])
df2 = spark.createDataFrame(df,schema=myschema)
print(type(df2))

会话打开,但它告诉我

"AttributeError: 'function' object has no attribute 'createDataFrame' "

然后,用“ .getOrCreate()重写上面的内容,它告诉我]

"FileNotFoundError: [Error 2] No such file or directory "home/...././bin/spark-submit'

我想Pycharm中的设置可能已关闭,但我真的不明白为什么。

python-3.x ubuntu pyspark pycharm
1个回答
0
投票

您需要使用方法调用getOrCreate(),而不是getOrCreate。另外,请确保将pyspark安装在pycharm中用于项目的python解释器中。您可以通过pycharm中的Preferences-> Python Interpreter访问它。

更新:尝试在本地下载spark binaries(例如spark 2.4.0),然后在bashrc中添加以下条目(并提供源)。我假设您使用的是spark 2.4.0,因此py4j专用于此版本。对于spark的其他任何版本,请检查py4j版本并进行相应添加。

export SPARK_HOME=/<your_path>/spark-2.4.0-bin-hadoop2.7
export PYTHONPATH=${SPARK_HOME}/python:$PYTHONPATH
export PYTHONPATH=${SPARK_HOME}/python/lib/py4j-0.10.7-src.zip:$PYTHONPATH
export PYSPARK_PYTHON=/<location_of_python_interpreter>

无论您要链接到PYSPARK_PYTHON的任何python解释器,请确保在pycharm项目中使用相同的python。

© www.soinside.com 2019 - 2024. All rights reserved.