平台简介

我校HPCAI融合智算中心集高性能计算与人工智能算力于一体，具备多机多卡协同计算、异构资源统一管理能力及弹性扩展架构，在计算密度与稳定性方面处于行业领先地位。中心目前运营HPC一期、二期、三期（ACD）、EDA四大智算集群，形成覆盖科研计算、AI训练推理等场景的全栈算力服务体系。

注意

当前平台所有集群仅开放给香港科技大学（广州）校内师生使用

HPC一期智算集群自2022年4月投入运营，提供0.246Pflops@FP64双精度计算能力和5.597Pflops@FP16半精度AI算力。该集群配置12个Intel CPU计算节点与4个NVIDIA A30 GPU计算节点，采用100Gb/s InfiniBand高性能网络，配备701TB并行文件存储系统。

HPC二期智算集群2023年9月正式启用，包含国际HPC AI平台与国产AI平台两大模块。其中HPC AI平台提供6.358Pflops@FP64通用算力与185.461Pflops@FP16智能算力，部署146个Intel CPU节点、20个AMD CPU节点、65个NVIDIA A800及15个NVIDIA A40 GPU节点；国产AI平台专注19.040Pflops@FP16国产化算力，配置8个Atlas 300T Pro训练节点与2个Atlas 300V Pro推理节点。全集群通过200Gb/s InfiniBand网络互联，构建4.2PB混合存储架构（309TB SSD+3.9PB HDD）。

HPC三期（ACD）智算集群于2025年1月上线运行，提供18.933Pflops@FP64双精度计算能力和1078.322Pflops@FP16半精度AI算力。该集群部署68个先进计算设备（ACD）节点，采用400Gb/s RoCE v2网络协议，配套17PB分布式存储系统。

HPC EDA智算集群自2023年7月投入运营，提供0.267Pflops@FP64计算能力与5.682Pflops@FP16 AI加速能力，包含20个Intel CPU节点与4个NVIDIA A30 GPU节点，通过200Gb/s InfiniBand网络连接1.2PB并行文件存储系统。