Slurm 命令查看节点 ID

问题描述 投票:0回答:1

我有一个程序在集群上因未知原因崩溃。我感觉这可能与特定节点的使用有关。是否有命令可以查看已完成的作业在集群的哪些节点上运行(我的意思是节点 ID)?我想检查一下该作业是否始终在同一节点上运行。

jobs slurm
1个回答
0
投票

sacct
命令可用于查询会计数据库:

sacct --start=2024-10-01 --format jobid,state,nodelist

使用

--format
,您可以指定要查看的列。
--start
允许查看过去的工作(默认情况下,
sacct
只会显示当天的工作)

© www.soinside.com 2019 - 2024. All rights reserved.