跳到主要内容

平台简介

我校HPCAI融合智算中心集高性能计算与人工智能算力于一体,具备多机多卡协同计算、异构资源统一管理能力及弹性扩展架构,在计算密度与稳定性方面处于行业领先地位。中心目前运营HPC一期、二期、三期(ACD)、EDA四大智算集群,形成覆盖科研计算、AI训练推理等场景的全栈算力服务体系。

注意

当前平台所有集群仅开放给香港科技大学(广州)校内师生使用

HPC一期智算集群自2022年4月投入运营,提供0.246Pflops@FP64双精度计算能力和5.597Pflops@FP16半精度AI算力。该集群配置12个Intel CPU计算节点与4个NVIDIA A30 GPU计算节点,采用100Gb/s InfiniBand高性能网络,配备701TB并行文件存储系统。

HPC二期智算集群2023年9月正式启用,包含国际HPC AI平台与国产AI平台两大模块。其中HPC AI平台提供6.358Pflops@FP64通用算力与185.461Pflops@FP16智能算力,部署146个Intel CPU节点、20个AMD CPU节点、65个NVIDIA A800及15个NVIDIA A40 GPU节点;国产AI平台专注19.040Pflops@FP16国产化算力,配置8个Atlas 300T Pro训练节点与2个Atlas 300V Pro推理节点。全集群通过200Gb/s InfiniBand网络互联,构建4.2PB混合存储架构(309TB SSD+3.9PB HDD)。

HPC三期(ACD)智算集群于2025年1月上线运行,提供18.933Pflops@FP64双精度计算能力和1078.322Pflops@FP16半精度AI算力。该集群部署68个先进计算设备(ACD)节点,采用400Gb/s RoCE v2网络协议,配套17PB分布式存储系统。

HPC EDA智算集群自2023年7月投入运营,提供0.267Pflops@FP64计算能力与5.682Pflops@FP16 AI加速能力,包含20个Intel CPU节点与4个NVIDIA A30 GPU节点,通过200Gb/s InfiniBand网络连接1.2PB并行文件存储系统。