Skip to main content

命令行提交

命令行提交用的是slurm命令集群调度系统,通过脚本形式提交任务至一个或多个计算节点,进行并行计算,可使用mpi或openmp并行。如果您在其他超算平台使用过对应的脚本,需要提供给技术工程师修改为适用于北鲲云超算平台的脚本。

一. 操作步骤

Step 1. 通过SSH连接启动一个管理节点,并连接进入管理节点;

Step 2. 提供文件传输上传输入文件,如何上传文件请点击查看Linux数据传输

Step 3. 查看SLURM集群所支持的partitions(分区);

sinfo

Step 4. 查询和加载软件,更多软件的加载,请点击查看加载预装软件

module avail        #查看全部
module spider xxxx #快速查找
module add xxxx #加载

Step 5. 创建提交脚本,参照gromacs运行脚本:su.sh

#!/bin/bash
module add GROMACS/2021-gromacs-cpu-new
mpiexec -v gmx_mpi mdrun -v -cpi tpr_file_name -deffnm tpr_file_name

Step 6. 使用sbatch提交到计算节点,参数详细介绍请查看slurm命令

sbatch -N 2 -p c-4-1 -n 8 -c 1 su.sh

Step 7. 查看SLURM集群正在运行的作业;

squeue

Step 8. 连接计算节点执行top查看CPU使用情况;

ssh c-4-1-worker0001    #连接计算节点
top #查看任务管理器
exit #退出计算节点

Step 9. 查看运行作业详细信息;

scontrol show jobs
  • /home/cloudam/examples/GROMACS 为作业执行路径。

  • /home/cloudam/examples/GROMACS/slurm-47.out 文件为作业输出日志,可实时查看作业运行信息。

Step 10. 取消程序运行,释放分配的计算节点(作业执行成功或失败计算节点会自动释放);

scancel JOBID

Step 11. 如何下载结果文件,请点击查看Linux数据传输

二. 计算节点资源使用率监控

  1. 通过仪表盘查看CPU、内存等资源使用率。
  2. 通过管理节点的监控按钮查看资源使用率,可登录到计算节点使用命令查看详细信息。