超算平台 | 交互式作业总结

2021-07-16  本文已影响0人  新_世_界

刚开始学超算平台,有的命令记录下来,供以后温习!

第一种: slurm 常用命令

命令 功能
speek 查看作业屏幕输出
sinfo 查看队列和节点信息
sacct 显示用户作业历史
scontrol 查看详细队列信息
squeue 显示当前作业状态
sbatch 批处理方式提交作业
scancel 取消指定作业
sattch 吸附到作业步,没看懂

假设有些集群设置以下队列,一般会有使用限制。For example,

队列 说明
You 允许但作业CPU核数为40-120,每核配10G内存,节点需独占使用,单节点配置为40核,1920G内存。
Are 允许单作业CPU核数为1-100,每核配比30G内存,节点可共享使用;单节点配置为80核,3T内存。
A 允许单作业CPU核数为1-45,每核配比16G内存,节点可共享使用,单节点配置为40核,182G内存。
Good 允许但作业CPU 核数为1-87,每核配比66G内存,节点可贡献使用;单节点配置为40核,2TG内存。
Dog 允许单作业CPU核数为1-32,推荐每核配比为42,每CPU配比20内存;单节点配置为96核,588G内存。

每个队列都有默认最长运行时间,需要注意。如果需要延长,将jobid附在邮件中发送至自己超算中心的邮箱即可。

需要注意的是:严禁在登录节点是运行作业和并行编程。如需交互操作,请申请计算资源:

srun  -p  small  -n  8  --pty  /bin/sh
============================================  
**账户存储使用情况**:
账户存储免费使用额度为:xxxT
hpc账户存储使用量为:xxxT
myhpc用户存储使用量为:xxxG
计费容量:xxx
============================================ 

使用完以后可以通过exit 命令退出

第二种: 分配式提交作业—salloc

基本语法为:salloc [options] [<command> [command args]]

salloc -p small -n 8   
============================================ 
salloc:Granted job allocation  xxx
saloc: Waiting for resource configuration
salloc: Nodes xxx are ready for job
账户存储免费使用额度为:xxxT
hpc账户存储使用量为:xxxT
myhpc用户存储使用量为:xxxG
计费容量:xxxT
============================================ 
上一篇 下一篇

猜你喜欢

热点阅读