我目前正在使用
Altair Grid Engine
,我需要找到一种方法来确定 Altair Grid Engine
中每个节点的状态(即,它是正在运行还是已停止)。我已经尝试了几个命令,但它们没有提供我需要的信息。
这是我到目前为止所做的尝试:
qconf -sel
:这个命令帮助我获取了集群中已注册节点的列表。但是,它不提供有关每个节点的状态或状况的任何具体信息。
qconf -se <cluster-node-name>
:此命令为我提供特定节点的集群信息。不幸的是,返回的信息不包含有关节点状态或状态的任何详细信息。
我尝试使用
qhost -F
,它确实显示集群信息,但不显示该节点的当前状态。
如果有人能指导我如何准确检测每个集群节点的状态,我将不胜感激。我还应该尝试其他命令或方法吗?
预先感谢您的协助!
取决于您所说的节点状态的含义。在 gridengine 中,状态显示在队列实例上。您可以尝试 qhost -q 或使用 qselect -qs u ;qselect -qs E ;qselect -qs a 获取列表 无法联系的主机上的队列实例、处于错误状态的队列实例或已报警的队列实例。
qstat -u -f
-f 选项会显示所有队列的摘要信息 与排队的作业列表一起显示。
示例:
qstat -f -q 12cores.q 队列名称 qtype resv/used/tot. load_avg 拱形状态 -------------------------------------------------- ------------------------ [电子邮件受保护] BIP 0/0/12 -NA- lx-amd64 au -------------------------------------------------- ------------------------ [电子邮件受保护] BIP 0/12/12 12.00 lx-amd64 -------------------------------------------------- ------------------------ [电子邮件受保护] BIP 0/12/12 11.97 lx-amd64 -------------------------------------------------- ------------------------ [电子邮件受保护] BIP 0/12/12 12.02 lx-amd64 -------------------------------------------------- ------------------------ [电子邮件受保护] BIP 0/12/12 12.03 lx-amd64 -------------------------------------------------- ------------------------