我想在crontab中安排一个pyspark脚本,每5分钟运行一次。我已使用此命令手动成功启动了脚本:
spark-submit script.py
问题是从crontab启动时,相同的命令似乎不起作用。日志不显示任何细节(它们被截断)
*/5 * * * * /path/script.sh
文件script.sh包含:spark-submit script.py
如果您对如何解决此问题有任何想法,请与我们联系。
你应该把它放在一个bash文件中并在cron上运行:
Bash文件Your_Script.sh
:
#!/bin/bash
echo "RUNNING JOB"
/opt/mapr/spark/spark-1.5.2/bin/spark-submit /Path/To/Your_Script.py parama1
所以你可以像这样从crantab轻松运行它:
32 18 * * * /Path/To/Your_Script.sh
我遇到了同样的问题。我通过两个步骤解决了这个问题:
source /etc/profile
:因为我的操作系统中的/ etc / profile中配置了$ JAVA_HOME和$ HADOOP_HOME。如果在〜/ .bashrc中配置了$ JAVA_HOME和$ HADOOP_HOME,那应该是source ~/.bashrc