用户工具

站点工具


mcloud:slurm

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

后一修订版
前一修订版
mcloud:slurm [2024/01/18 15:19] – 创建 - 外部编辑 127.0.0.1mcloud:slurm [2025/03/20 11:55] (当前版本) pengge
行 16: 行 16:
  
 > –mem=1 请求 1 MB 内存 > –mem=1 请求 1 MB 内存
-+>
 > –time=1 作业总的运行时间限制为 1 分钟 > –time=1 作业总的运行时间限制为 1 分钟
-+>
 > –gres=gpu:1 请求 1 块 gpu 卡 > –gres=gpu:1 请求 1 块 gpu 卡
-+>
 > hostname 为要执行的作业命令 > hostname 为要执行的作业命令
-+>
 > –output=%j.out 为作业的输出 > –output=%j.out 为作业的输出
-+>
 > –error=%j.err 为作业的错误输出 > –error=%j.err 为作业的错误输出
  
行 101: 行 101:
 #SBATCH --gpus-per-task=1    # 每个 cpu 核 使用 1 块 gpu 卡 #SBATCH --gpus-per-task=1    # 每个 cpu 核 使用 1 块 gpu 卡
  
-module load intel/2020+module load mkl mpi
 module load cuda/11.6 module load cuda/11.6
-module load pwmat/2022.01.30+module load pwmat
  
-mpirun -np $SLURM_NPROCS -iface ib0 PWmat | tee output+mpirun -np $SLURM_NPROCS PWmat | tee output
  
 资源五: 资源五:
行 190: 行 190:
 #SBATCH --gres=gpu:4 #SBATCH --gres=gpu:4
 #SBATCH --gpus-per-task=1 #SBATCH --gpus-per-task=1
 +#SBATCH --nodelist=gn32     # 指定节点提交
  
-module load intel/2020+module load mpi mkl
 module load cuda/11.6 module load cuda/11.6
-module load pwmat/2022.01.30+module load pwmat
  
-mpirun -np $SLURM_NPROCS -iface ib0 PWmat | tee output+mpirun -np $SLURM_NPROCS PWmat | tee output
 </code> </code>
  
行 252: 行 253:
 === slurm 环境变量 === === slurm 环境变量 ===
  
-^变量                     ^描述                                                     ^ +^ 变量                     ^ 描述                                                     ^ 
-|$SLURM_JOB_ID          |此作业 JobID                                              +| $SLURM_JOB_ID            | 此作业 JobID                                             
-|$SLURM_SUBMIT_DIR      |作业提交目录的路径                                              +| $SLURM_SUBMIT_DIR        | 作业提交目录的路径                                       
-|$SLURM_SUBMIT_HOST     |作业提交节点的主机名                                             +| $SLURM_SUBMIT_HOST       | 作业提交节点的主机名                                     
-|$SLURM_JOB_NODELIST    |分配给作业的节点列表                                             +| $SLURM_JOB_NODELIST      | 分配给作业的节点列表                                     
-|$SLURM_GPUS            |分配 GPUs 数量                                             +| $SLURM_GPUS              | 分配 GPUs 数量                                           
-|$SLURM_MEM_PER_GPU     |每个 GPU 内存                                              +| $SLURM_MEM_PER_GPU       | 每个 GPU 内存                                            
-|$SLURM_MEM_PER_NODE    |每个节点的内存 Same as –mem                                   +| $SLURM_MEM_PER_NODE      | 每个节点的内存 Same as –mem                              
-|$SLURM_NTASKS          |Same as –ntasks. The number of tasks.                  +| $SLURM_NTASKS            | Same as –ntasks. The number of tasks.                    
-|$SLURM_NTASKS_PER_GPU  |Number of tasks requested per GPU.                     +| $SLURM_NTASKS_PER_GPU    | Number of tasks requested per GPU.                       
-|$SLURM_NTASKS_PER_NODE |Number of tasks requested per node.                    +| $SLURM_NTASKS_PER_NODE   | Number of tasks requested per node.                      
-|$SLURM_NTASKS_PER_CORE |Number of tasks requested per core.                    +| $SLURM_NTASKS_PER_CORE   | Number of tasks requested per core.                      
-|$SLURM_NPROCS          |Same as –ntasks. See $SLURM_NTASKS.                    +| $SLURM_NPROCS            | Same as –ntasks.                                         
-|$SLURM_NNODES          |Total number of nodes in the job’s resource allocation.| +| $SLURM_NNODES            | Total number of nodes in the job’s resource allocation.  
-|$SLURM_TASKS_PER_NODE  |Number of tasks to be initiated on each node.          +| $SLURM_TASKS_PER_NODE    | Number of tasks to be initiated on each node.            
-|$SLURM_ARRAY_JOB_ID    |Job array’s master job ID number.                      +| $SLURM_ARRAY_JOB_ID      | Job array’s master job ID number.                        
-|$SLURM_ARRAY_TASK_ID   |Job array ID (index) number.                           +| $SLURM_ARRAY_TASK_ID     | Job array ID (index) number.                             
-|$SLURM_ARRAY_TASK_COUNT|Total number of tasks in a job array.                  +| $SLURM_ARRAY_TASK_COUNT  | Total number of tasks in a job array.                    
-|$SLURM_ARRAY_TASK_MAX  |Job array’s maximum ID (index) number.                 +| $SLURM_ARRAY_TASK_MAX    | Job array’s maximum ID (index) number.                   
-|$SLURM_ARRAY_TASK_MIN  |Job array’s minimum ID (index) number.                 |+| $SLURM_ARRAY_TASK_MIN    | Job array’s minimum ID (index) number.                   |
  
mcloud/slurm.1705562397.txt.gz · 最后更改: 2024/01/18 15:19 由 127.0.0.1