跳到主要内容

模型适配列表(持续更新)

提示

如有其他软件/模型适配需求,请联系hpc@hkust-gz.edu.cn

训练

模型完整名称适配情况指导文档
qwen3-30b-a3b已适配MindSpeed-LLM框架进行训练/微调,参考指导:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档
Qwen2.5-Coder-32B/14B/7B-Instruct; Qwen3-Coder-30B-A3B-Instruct已适配MindSpeed-LLM框架进行微调参考指导:参考文档参考文档
Qwen3-8B-Instruct已适配MindSpeed-LLM 框架全参SFT微调训练:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档
Qwen/Qwen3-VL-8B-Instruct已适配MindSpeed-MM框架微调:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档
Qwen/Qwen3-8B已适配MindSpeed-LLM 框架全参SFT微调训练:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档
Qwen/Qwen3-14B已适配MindSpeed-LLM 框架全参SFT微调训练:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档
Qwen/Qwen3-235B-A22B-Thinking-2507已适配MindSpeed LLM安装指导:参考文档,大模型指令微调:参考文档,微调脚本:参考文档
Qwen3-8B已适配MindSpeed-LLM 框架全参SFT微调训练:参考文档
Qwen3-8B已适配参考文档
Qwen3-8B已适配参考文档
Qwen3-8B已适配参考链接:参考文档参考文档
Qwen3-8B已适配MindSpeed-LLM 框架全参SFT微调训练:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档
Wan 2.2已适配MindSpeed-MM框架微调:参考文档,MindSpeed-MM 对 Wan2.2-T2V-A14B 模型进行微调实践:参考文档
Qwen2.5-72B-Instruct已适配MindSpeed LLM安装指导:参考文档,预训练:参考文档,lora微调:参考文档,模型lora微调脚本:参考文档,预训练:参考文档
Qwen3-8b已适配MindSpeed-LLM 预置稠密大模型:参考文档,安装指导:参考文档,微调指导文档:参考文档
Qwen3-32b已适配MindSpeed-LLM 预置稠密大模型:参考文档,安装指导:参考文档,微调指导文档:参考文档
Qwen3-VL-32b已适配MindSpeed-MM框架微调:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档
Qwen3(VL)-4B/8B已适配MindSpeed-MM强化学习:参考文档
Qwen2-7B / LLaMA2-7B已适配MindSpeed-LLM 预置稠密大模型:参考文档,安装指导:参考文档,LoRA 微调:参考文档,LlaMA2-7B微调脚本:参考文档
Qwen-3系列,如14B,32B;LLaMA-3.2 8B/14BMindSpeed-LLM官网支持LLaMA3.2-1B/3B;VeRL暂不支持LLaMA-3.2 8B/14B和qwen3-14bDAPO操作说明:参考文档,安装指南:参考文档,Qwen3-32B模型mindspeed-rl强化学习脚本:参考文档
LLaMA3-8B-Instruct / LLaMA3.1-8B-Instruct已适配MindSpeed-LLM 预置稠密大模型:参考文档,LoRA 微调:参考文档,安装指导:参考文档,llamafactory训练参考:参考文档,Llamafactory框架训练脚本:参考文档
DeepSeek-R1-Distill-Llama-70B 或 Llama-3-70B已适配MindSpeed LLM安装指导:参考文档,分布式预训练:参考文档,llama3-70B预训练脚本:参考文档
Deepseek V3.2已适配MindSpeed LLM安装指导:参考文档,微调脚本:参考文档,模型微调脚本:参考文档
openai/gpt-oss-120bgpt-oss-20b支持,120B暂无安装指导:参考文档,操作说明:参考文档,gpt-oss-20b模型微调脚本:参考文档

推理

提示

部分参考文档为同框架部署指导文档,可参考。

模型完整名称推理引擎适配情况参考文档
Qwen3-VL-30B-A3B-InstructvLLM已适配参考文档参考文档
qwen3-30b-a3bvLLM已适配参考文档
Qwen3-VL 235B-A22BvLLM已适配参考文档
Qwen3-VL-32B-ThinkingvLLM已适配参考文档
Qwen2.5-Coder-32B/14B/7B-Instruct; Qwen3-Coder-30B-A3B-InstructvLLM,sglang已适配参考文档参考文档
Qwen3-8BMindIE / vLLM已适配参考文档参考文档
Qwen2-7BvLLM / MindIE已适配参考文档参考文档
Qwen/Qwen3-8BvLLM已适配参考文档
Qwen/Qwen3-14BvLLM已适配参考文档
Qwen/Qwen2.5-7B-InstructvLLM已适配参考文档
Qwen/Qwen2.5-VL-7B-InstructvLLM已适配参考文档
Qwen/Qwen2.5-14B-InstructvLLM已适配参考文档
Qwen/Qwen3-VL-Embedding-2BvLLM已适配参考文档
Qwen/Qwen3-VL-Embedding-8BvLLM已适配参考文档
Qwen/Qwen3-Embedding-8BvLLM已适配参考文档
Qwen/Qwen3-Embedding-4BvLLM已适配参考文档
Qwen/Qwen3-Embedding-0.6BvLLM已适配参考文档
Qwen/Qwen3-235B-A22B-Thinking-2507liteLLM, vLLM已适配参考文档参考文档参考文档
Qwen3-8BvLLM已适配参考文档
Qwen3-8Bsglang已适配参考文档参考文档
Qwen3-8BvLLM已适配参考文档
Qwen3-32BvLLM已适配参考文档
Qwen3-235BvLLM已适配参考文档
Qwen3-VL-235BvLLM已适配参考文档
Qwen3-OminivLLM已适配参考文档
Qwen3(VL)-4B/8B/32BvLLM已适配参考文档
Qwen3-235B-A22B/Qwen3-235B-A22B-W8A8vllm/omni_infer已适配参考文档
Wan 2.2已适配参考文档
DeepSeek-R1-Distill-70B (Int8/W8A8 量化版)vLLM 或 MindIE已适配参考文档
Deepseek V3.2liteLLM, vLLM已适配参考文档参考文档参考文档
DeepSeek-V3vLLM已适配参考文档
DeepseekocrvLLM已适配参考文档
Kimi-K2-ThinkingliteLLM, vLLM已适配参考文档参考文档参考文档
Kimi-Audiopytorch已适配暂无
LLaMA3-8B-InstructMindIE已适配参考文档
openai/gpt-oss-120bliteLLM, vLLM已适配参考文档参考文档参考文档
Whisper-Large-V3pytorch已适配参考文档
BAAI/bge-base-en-v1.5vLLMTEI已适配,vllm未适配参考文档
BAAI/bge-large-en-v1.5vLLMTEI已适配,vllm未适配参考文档
LLaDA2.0-flashSgLang已提交模型适配团队,迁移适配中;已基于SGLang正常其服务并调用成功--1.20参考文档
HunyuanVideo-1.5已适配参考文档
speaker-diarization-3.1pytorch已适配参考文档