我正在运行EMR集群并尝试使用Zeppelin笔记本进行数据分析。
版本:发行标签:emr-5.2.1 Hadoop发行版:亚马逊2.7.3 Hive 2.1.0 Spark 2.0.2 Zeppelin 0.6.2
在运行查询时,我一直遇到Zeppelin挂起的问题,我无法恢复它。我试过了:
- 重新启动解释器
- SSH进入主节点并运行zeppelin_daemon.sh restart
(尝试运行hadoop / root / zeppelin,并运行带有选项reload
,start/stop
,upstart
的脚本)
每次我使用守护进程shell脚本时,它都会告诉我它已经停止/启动了,但是当我运行状态时,我得到了这个:
Zeppelin running but process is dead [FAILED]
我似乎唯一能做的就是杀死我的集群并建立一个新的集群,这在很多层面都很疯狂。
那么......重启Zeppelin的官方支持方式是什么?
我ssh'ed进入主节点,然后运行
$ sudo stop zeppelin
zeppelin stop/waiting
$ sudo start zeppelin
zeppelin start/running, process 24434
紧接着,刷新Zeppelin给了我一个503,但是大约2分钟后,UI再次可用。我检查了/ var / log / zeppelin中的日志,配置设置需要一些时间。
EMR上的服务使用upstart,重新启动它们的方法是使用“sudo stop <service-name>; sudo start <service-name>”。 (start和stop命令位于/ sbin中,默认位于PATH中。)
注意:当前在EMR上存在一个限制,阻止/ sbin / restart正常工作,因此必须使用stop然后启动而不是重启。
你有没有尝试过:
sudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop/start?
这可能听起来有点傻,我不确定它为什么会起作用。但是,我遇到了发出守护进程停止/启动并让它工作的问题。但是,如果我可以让守护进程运行,启动我知道可行的笔记本然后转换到问题笔记本有时可以修复挂起,至少到我可以恢复我所做的那一点。