平台软硬件资源介绍
HPC AI融合智算中心(二期)通用X86 NVIDIA平台的硬件资源
节点配置
节点类别 | 节点数量(台) | 主要规格 | |||
---|---|---|---|---|---|
cpu型号 | 内存大小 | GPU卡型号 | |||
管理节点 | 2 | 2*Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz | 512G | / | |
登录节点 | 2 | 2*Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz | 512G | / | |
CPU1 | 110 | 2*Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz | 512G | / | |
CPU2 | 30 | 2*Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz | 512G | / | |
CPU3 | 20 | 2* AMD EPYC 7763 64-Core Processor 2450 | 512G | / | |
GPU1 | 50 | 2*Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz | 1024G | 8*NVIDIA A800-SXM4-80GB | |
GPU2 | 15 | 2*Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz | 2048G | 8*NVIDIA A800-SXM4-80GB | |
GPU3 | 15 | 2*Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz | 1024G | 8*NVIDIA A40-48GB | |
BIG MEM | 6 | 4*Intel(R) Xeon(R) Gold 6348H CPU @ 2.30GHz | 3072G | / |
节点性能
CPU节点
节点类别 | 单核主频 | 单节点核心数 | 内存 | 节点数 | 总核心数 | 理论峰值/Gflops |
---|---|---|---|---|---|---|
CPU1 | 2.60GHz | 64 | 512G | 110 | 7040 | |
CPU2 | 2.60GHz | 64 | 512G | 30 | 1920 | |
CPU3 | 2.45GHz | 128 | 512G | 20 | 2560 | |
BIGMEM | 2.30GHz | 96 | 3072G | 6 | 1152 |
GPU节点
GPU服务器 整体配置采用NVLINK 400GB/S
节点类别 | 单核主频 | 单节点核心数 | 内存 | 节点数 | 总核心数 | 单GPU卡显存 | GPU卡总显存 | 理论峰值/Gflops |
---|---|---|---|---|---|---|---|---|
GPU1 | 2.60GHz | 64 | 1024G | 50 | 3200 | A800-SXM4-80GB | 640GB | |
GPU2 | 2.60GHz | 64 | 2048G | 15 | 960 | A800-SXM4-80GB | 640GB | |
GPU3 | 2.60GHz | 64 | 1024G | 15 | 960 | NVIDIA A40 48GB | 384GB |
存储配置
存储介质类型 | 挂载点 | 存储空间 | 文件系统 | 备注 |
---|---|---|---|---|
SSD | /hpc2ssd | 309T | GPFS EC | 用于提高HPC 任务存储IO 读写性能,如长时间不使用的数据请迁移到HHD 避免。 |
HDD | /hpc2hdd | 3.9P | GPFS EC | 用于HPC 一般用户存储读写性能及数据存储 |
国产AI硬件资源
节点配置
节点类别 | 节点数量(台) | 主要规格 | |||
---|---|---|---|---|---|
cpu型号 | 内存大小 | GPU卡型号 | 备注 | ||
AI推理节点 | 2 | 2*kunpeng920-48C @ 2.60GHz | 512G | Atlas 300V Pro | |
AI训练节点 | 8 | 4*kunpeng920-48C @ 2.60GHz | 1024G | Ascend 910 Pro B | (GPU卡以芯片形式嵌入主板中) |
AI管理节点 | 2 | 2*kunpeng920-32C @ 2.60GHz | 512G | / | |
存储节点 | 4 | 2*Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz | 512G |
节点性能
CPU 节点
节点类别 | 单核主频 | 单节点核心数 | 内存 | 节点数 | 总核心数 | 理论峰值/Gflops(FP16) |
---|---|---|---|---|---|---|
AI管理节点 | 2.60GHz | 64 | 512G | 2 | 128 | 2662.4 |
GPU 节点
节点类别 | 单核主频 | 单节点核心数 | 内存 | 节点数 | 总核心数 | 单GPU卡显存 | GPU卡总显存 | 理论峰值/Gflops(FP16) | AI算力 |
---|---|---|---|---|---|---|---|---|---|
AI推理节点 | 2.60GHz | 96 | 512G | 2 | 192 | 48G | 768G | 3993.6 | 2240TOPS INT8 |
AI训练节点 | 2.60GHz | 192 | 1024G | 8 | 1536 | 32G HBM | 2048G | 7987.2 | 17.92PFlops |
存储节点
节点类别 | 单核主频 | 单节点核心数 | 内存 | 节点数 | 总核心数 | 理论峰值/Gflops |
---|---|---|---|---|---|---|
存储 | 2.60GHz | 32 | 512G | 4 | 128 | 21299.2*4 |
存储配置
存储介质类型 | 挂载点 | 存储空间 | 文件系统 | 备注 |
---|---|---|---|---|
SSD/HDD | /datapool | 771.82T(裸容量) | EC | 用于12台AI服务器。 |
软件资源
操作系统资源
节点类别 | 操作系统 |
---|---|
管理节点 | Red Hat Enterprise Linux release 8.4 (Ootpa) |
登录节点 | Ubuntu 20.04 LTS |
CPU1 | Ubuntu 20.04 LTS |
CPU2 | Red Hat Enterprise Linux release 8.4 (Ootpa) |
CPU3 | Ubuntu 20.04 LTS |
GPU1 | Ubuntu 20.04 LTS |
GPU2 | Red Hat Enterprise Linux release 8.4 (Ootpa) |
GPU3 | Ubuntu 20.04 LTS |
BIGMEM | Ubuntu 20.04 LTS |
编译环境资源
CPU1、CPU3、大内存节点
编译工具 | 版本 | 加载方法 |
---|---|---|
GCC | 9.4.0(系统默认) | 直接使用 |
13.1 | module load compilers/gcc-13.1.0 | |
python | 3.8.4(系统默认) | 直接使用 |
icc | 2023.1.0 | module load compilers/icc-2023.1.0 |
cmake | 3.27.0 | module load cmake/3.27.0 |
java | 1.8.11 | 直接使用 |
CPU2节点
编译工具 | 版本 | 加载方法 |
---|---|---|
GCC | 8.4.1(系统默认) | 直接使用 |
13.1 | module load compilers/gcc-13.1.0 | |
python | 3.6.8(系统默认) | 直接使用 |
icc | 2023.1.0 | module load compilers/icc-2023.1.0 |
cmake | 3.27.0 | module load cmake/3.27.0 |
java | 1.8.11 | 直接使用 |
GPU1节点
编译工具 | 版本 | 加载方法 |
---|---|---|
GCC | 9.4.0(系统默认) | 直接使用 |
gcc13.1 | module load compilers/gcc-13.1.0 | |
python | 3.8.4(系统默认) | 直接使用 |
icc | 2023.1.0 | module load compilers/icc-2023.1.0 |
cmake | 3.27.0 | module load cmake/3.27.0 |
cuda | 11.3 (cudnn 8.9.3 for cuda11.x ) | module load cuda/11.3 |
11.7 (cudnn 8.9.3 for cuda11.x ) | module load cuda/11.7 | |
11.8 (cudnn 8.9.3 for cuda11.x ) | module load cuda/11.8 | |
12.0 (cudnn 8.9.3 for cuda12.x ) | module load cuda/12.0 | |
12.2 (cudnn 8.9.3 for cuda12.x ) | module load cuda/12.2 | |
nvidia-sdk | 23.7 | module load nvhpc/23.7 |
数学库
软件名称 | 版本 | 软件加载方法 |
---|---|---|
fftw | 3.3.10 | |
intel MKL | 2023 | module load compilers/mkl-2023.1.0 |
nvidia-sdk | 23.7 | module load nvhpc/23.7 |
blas/scalapack/lapack | / |
MPI环境资源
序号 | 软件名称 | 版本 | 安装路径 | 加载方法 |
---|---|---|---|---|
1 | mpich | 4.1.2 gcc版 | /opt/mpi/mpich-4.1.2 | module load mpi/mpich-4.1.2 |
2 | 4.1.2 icc版 | /opt/mpi/mpich-4.1.2_icc-2023.1.0 | module load mpi/mpich-4.1.2_icc-2023.1.0 | |
3 | mvapich | 3.0b gcc版 | /opt/mpi/mvapich-3.0b | module load mpi/mvapich-3.0b |
4 | 3.0b icc版 | /opt/mpi/mvapich-3.0b_icc-2023.1.0 | module load mpi/mvapich-3.0b_icc-2023.1.0 | |
5 | mvapich | 2-2.3.7-1 gcc版 | /opt/mpi/mvapich2-2.3.7-1 | module load mpi/mvapich2-2.3.7-1 |
6 | 2-2.3.7-1 icc版 | /opt/mpi/mvapich2-2.3.7-1_icc-2023.1.0 | module load mpi/mvapich2-2.3.7-1_icc-2023.1.0 | |
7 | openmpi | 4.1.5 gcc版 | /opt/mpi/openmpi-4.1.5 | module load mpi/openmpi-4.1.5 |
8 | 4.1.5 icc版 | /opt/mpi/openmpi-4.1.5_icc-2023.1.0 | module load mpi/openmpi-4.1.5_icc-2023.1.0 | |
9 | 4.1.5 gpu版 | /hpc2ssd/softwares/cuda/openmpi-4.1.5 | module load mpi/openmpi-4.1.5_gpu | |
10 | Intel_mpi | 2021.9 | /opt/intel/oneapi/mpi/2021.9.0 | module load intelmpi-2021.9.0 |
11 | nvidia sdk | 23.7 | /hpc2ssd/softwares/nvidia/hpc_sdk/ | module load nvhpc/23.7 |
应用软件资源
序号 | 软件名称 | 版本 | 安装路径 | 加载方式 |
---|---|---|---|---|
1 | GAUSS | g16 | /hpc2ssd/softwares/GAUSS | module load |
2 | HDF5 | 1.14.1-2 | /hpc2ssd/softwares/HDF5-1.14.1-2 | module load |
3 | PnetCDF | 1.12.3 | /hpc2ssd/softwares/PnetCDF-1.12.3 | module load |
4 | QE | 7.2 | /hpc2ssd/softwares/QE-7.2 | module load |
5 | R | 4.3.1 | R-4.3.1 | module load R/4.3.1 |
6 | RASPA2 | /hpc2ssd/softwares/RASPA2 | module load | |
7 | WPS | 4.2 | /hpc2ssd/softwares/WPS-4.2 | |
8 | WRF | 4.2.1 | /hpc2ssd/softwares/WRF-4.2.1 | |
9 | abacus | 3.3.0 | /hpc2ssd/softwares/abacus | |
10 | anaconda3 | 2023 | /hpc2ssd/softwares/anaconda3 | |
11 | ccpem | 20221108 | /hpc2ssd/softwares/ccpem-20221108 | |
12 | cistem | 1.0.0 | /hpc2ssd/softwares/cistem-1.0.0-beta | |
13 | cuda | /hpc2ssd/softwares/cuda | ||
14 | dushin | /hpc2ssd/softwares/dushin | ||
15 | dynamo | /hpc2ssd/softwares/dynamo | ||
16 | elk | 8.5.10 | /hpc2ssd/softwares/elk-8.5.10 | |
17 | gams | 44.1 | /hpc2ssd/softwares/gams44.1_linux_x64_64_sfx | |
18 | gromacs | 2023.2 | /hpc2ssd/softwares/gromacs-2023.2 | module load gromacs/2023.2 |
19 | jasper | 1.9 | j/hpc2ssd/softwares/asper-1.9 | |
20 | lammps_parallel | 3-Mar-20 | /hpc2ssd/softwares/lammps_parallel | module load lammps/2022-parallel |
21 | lammps_serial | /hpc2ssd/softwares/lammps_serial | module load lammps/2022-serial | |
22 | netcdf | /hpc2ssd/softwares/netcdf | ||
23 | pwtk-2.0 | /hpc2ssd/softwares/pwtk-2.0 | ||
24 | pycharm | 2023.1.4 | /hpc2ssd/softwares/pycharm-community-2023.1.4 | |
25 | pytorch | 2.0.1 | /hpc2ssd/softwares/pytorch-2.0.1 | |
26 | relion | /hpc2ssd/softwares/relion | ||
27 | scipion | /hpc2ssd/softwares/scipion | ||
28 | tensorflow-gpu | /hpc2ssd/softwares/tensorflow-gpu | ||
29 | vasp | 6.3.2 | /hpc2ssd/softwares/vasp.6.3.2 | module load vasp/6.3.2 |
30 | docker | 24.0.5 | /usr/bin/docker | |
31 | openFoam | 11 | /opt/openfoam11 |
生信类软件
序号 | 软件名称 | 加载方法 | 备注 |
---|---|---|---|
1 | Aspera | source /hpc2ssd/softwares/anaconda3/bin/activate biological | 秘钥文件:/hpc2ssd/softwares/anaconda3/envs/biological/etc/asperaweb_id_dsa.openssh |
2 | SRA tool kit | module load biological/sratoolkit | |
3 | fastp | source /hpc2ssd/softwares/anaconda3/bin/activate biological | |
4 | fastQc | source /hpc2ssd/softwares/anaconda3/bin/activate biological | |
5 | multiqc | source /hpc2ssd/softwares/anaconda3/bin/activate biological | |
6 | Bbmap | source /hpc2ssd/softwares/anaconda3/bin/activate biological | |
7 | Megahit | source /hpc2ssd/softwares/anaconda3/bin/activate biological | |
8 | prodigal | module load biological/prodigal | |
9 | hmmer3 | source /hpc2ssd/softwares/anaconda3/bin/activate biological | |
10 | CRISPRCasFinder | module load biological/crisprcasfinder | |
11 | MAFFT | source /hpc2ssd/softwares/anaconda3/bin/activate biological | |
12 | Blast | source /hpc2ssd/softwares/anaconda3/bin/activate biological | |
13 | muscle | source /hpc2ssd/softwares/anaconda3/bin/activate biological | |
14 | Bowtie2 | source /hpc2ssd/softwares/anaconda3/bin/activate biological | |
15 | pseqsid | 直接使用 | |
16 | Mmseq | module load biological/mmseqs |