我有一个虚拟机,上面有
Spark 1.3
,但我想将其升级到 Spark 1.5
,主要是因为 1.3 中没有某些受支持的功能。我是否可以将 Spark
版本从 1.3
升级到 1.5
如果可以,我该怎么做?
预构建的 Spark 发行版,就像我相信您基于“您的另一个问题”使用的发行版一样,“升级”相当简单,因为 Spark 实际上并未“安装”。其实,你所要做的就是:
spark-1.3.1-bin-hadoop2.6
SPARK_HOME
vagrant@sparkvm2:~$ cd $SPARK_HOME vagrant@sparkvm2:/usr/local/bin/spark-1.3.1-bin-hadoop2.6$ cd .. vagrant@sparkvm2:/usr/local/bin$ ls ipcluster ipcontroller2 iptest ipython2 Spark-1.3.1-bin-hadoop2.6 ipcluster2 ipengine iptest2 jsonschema ipcontroller ipengine2 ipython pygmentize vagrant@sparkvm2:/usr/local/bin$ sudo wget
http://apache.tsl.gr/spark/spark-1.5.2/spark-1.5.2-bin-hadoop2.6.tgz[...] vagrant@sparkvm2:/usr/local/bin$ ls ipcluster ipcontroller2 iptest ipython2 Spark-1.3.1-bin-hadoop2.6 ipcluster2 ipengine iptest2 jsonschema Spark-1.5.2-bin-hadoop2.6.tgz ipcontroller ipengine2 ipython pygmentize
wget
使用的确切镜子可能与我的不同,具体取决于您所在的位置;选择要下载的包类型后,您可以通过单击
下载页面中的“下载 Spark”链接来获取此信息。
tgz
文件vagrant@sparkvm2:/usr/local/bin$ sudo tar -xzf Spark-1.*.tgz vagrant@sparkvm2:/usr/local/bin$ ls ipcluster ipcontroller2 iptest ipython2 Spark-1.3.1-bin-hadoop2.6 ipcluster2 ipengine iptest2 jsonschema Spark-1.5.2-bin-hadoop2.6 ipcontroller ipengine2 ipython pygmentize Spark-1.5.2-bin-hadoop2.6.tgz
spark-1.5.2-bin-hadoop2.6
。
相应更新SPARK_HOME
请注意:
您不需要删除以前的 Spark 发行版,只要所有相关的环境变量都指向新的发行版即可。这样,您甚至可以在新旧版本之间快速“来回”移动,以防您想要测试(即您只需更改相关的环境变量)。
sudo
tgz
tgz
tar
命令以指向特定文件(即没有如上所述的 *
通配符)。
SPARK_HOME
/opt/spark
spark-2.2.1-bin-hadoop2.7.tgz
- 可以使用wget
创建最新下载的符号链接 - ln -s /opt/spark-2.2.1 /opt/spark
$SPARK_HOME/conf
ln -s /opt/spark-x.x.x /opt/spark
从 Azure 门户转到 AzSynapseSparkPool Powershell
步骤:2:使用 Update-AzSynapseSparkPool powershell cmdlet 升级 Apache Spark 池,如下所示。
检查Apache Spark的版本:
get-AzSynapsesparkpool -WorkspaceName <Synapseworkspacename>
更新Spark版本:
update-AzSynapseSparkPool -WorkspaceName <Synapseworkspacename> -Name <SparkPoolName> -sparkversion 3.4