跳到主要内容

作业管理

slurm作业管理

显示队列、节点信息:sinfo

step1

查看队列中的作业信息:squeue

step2

查看详细分区(队列)信息:scontrol show partition

step3

查看详细节点信息:scontrol show node

step4

查看详细作业信息:scontrol show job $JOBID

step5

查看作业动态输出:speek

step6

注意:该命令不是slurm自带命令,是封装后的

终止作业:scancel job_id

step7

挂起排队的作业: scontrol hold job_id

step8 step8_2

继续排队中挂起作业:scontrol release _job_id

step9

挂起运行的作业:scontrol suspend job_id

step10

恢复挂起运行中的作业:scontrol resume job_id

step11

unischeduler 作业管理

查看节点信息: bhosts

step1

查看队列信息:bqueues

step2

查看app信息: bapp

step3

查看作业信息: bjobs

step4

查看详细作业信息: bjobs -l jobid

step5

查看作业动态输出: jctrl peek -f job_id

step6

终止作业: bkill job_id

step7

挂起作业: jctrl stop job_id

step8

恢复作业 jctrl resume job_id

step9