命令行提交
命令行提交用的是slurm命令集群调度系统,通过脚本形式提交任务至一个或多个计算节点,进行并行计算,可使用mpi或openmp并行。如果您在其他超算平台使用过对应的脚本,需要提供给技术工程师修改为适用于北鲲云超算平台的脚本。
一. 操作步骤
Step 1. 通过SSH连接启动一个管理节点,并连接进入管理节点;
Step 2. 提供文件传输上传输入文件,如何上传文件请点击查看Linux数据传输;
Step 3. 查看SLURM集群所支持的partitions(分区);
sinfo
Step 4. 查询和加载软件,更多软件的加载,请点击查看加载预装软件;
module avail #查看全部
module spider xxxx #快速查找
module add xxxx #加载
Step 5. 创建提交脚本,参照gromacs运行脚本:su.sh
#!/bin/bash
module add GROMACS/2021-gromacs-cpu-new
mpiexec -v gmx_mpi mdrun -v -cpi tpr_file_name -deffnm tpr_file_name
Step 6. 使用sbatch提交到计算节点,参数详细介绍请查看slurm命令;
sbatch -N 2 -p c-4-1 -n 8 -c 1 su.sh
Step 7. 查看SLURM集群正在运行的作业;
squeue
Step 8. 连接计算节点执行top查看CPU使用情况;
ssh c-4-1-worker0001 #连接计算节点
top #查看任务管理器
exit #退出计算节点
Step 9. 查看运行作业详细信息;
scontrol show jobs
/home/cloudam/examples/GROMACS 为作业执行路径。
/home/cloudam/examples/GROMACS/slurm-47.out 文件为作业输出日志,可实时查看作业运行信息。
Step 10. 取消程序运行,释放分配的计算节点(作业执行成功或失败计算节点会自动释放);
scancel JOBID
Step 11. 如何下载结果文件,请点击查看Linux数据传输;
二. 计算节点资源使用率监控
- 通过
仪表盘
查看CPU、内存等资源使用率。 - 通过管理节点的
监控
按钮查看资源使用率,可登录到计算节点使用命令查看详细信息。