模型适配列表(持续更新)
提示
如有其他软件/模型适配需求,请联系hpc@hkust-gz.edu.cn
训练
| 模型完整名称 | 适配情况 | 指导文档 |
|---|---|---|
| qwen3-30b-a3b | 已适配 | MindSpeed-LLM框架进行训练/微调,参考指导:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档 |
| Qwen2.5-Coder-32B/14B/7B-Instruct; Qwen3-Coder-30B-A3B-Instruct | 已适配 | MindSpeed-LLM框架进行微调参考指导:参考文档,参考文档 |
| Qwen3-8B-Instruct | 已适配 | MindSpeed-LLM 框架全参SFT微调训练:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档 |
| Qwen/Qwen3-VL-8B-Instruct | 已适配 | MindSpeed-MM框架微调:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档 |
| Qwen/Qwen3-8B | 已适配 | MindSpeed-LLM 框架全参SFT微调训练:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档 |
| Qwen/Qwen3-14B | 已适配 | MindSpeed-LLM 框架全参SFT微调训练:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档 |
| Qwen/Qwen3-235B-A22B-Thinking-2507 | 已适配 | MindSpeed LLM安装指导:参考文档,大模型指令微调:参考文档,微调脚本:参考文档 |
| Qwen3-8B | 已适配 | MindSpeed-LLM 框架全参SFT微调训练:参考文档 |
| Qwen3-8B | 已适配 | 参考文档 |
| Qwen3-8B | 已适配 | 参考文档 |
| Qwen3-8B | 已适配 | 参考链接:参考文档,参考文档 |
| Qwen3-8B | 已适配 | MindSpeed-LLM 框架全参SFT微调训练:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档 |
| Wan 2.2 | 已适配 | MindSpeed-MM框架微调:参考文档,MindSpeed-MM 对 Wan2.2-T2V-A14B 模型进行微调实践:参考文档 |
| Qwen2.5-72B-Instruct | 已适配 | MindSpeed LLM安装指导:参考文档,预训练:参考文档,lora微调:参考文档,模型lora微调脚本:参考文档,预训练:参考文档 |
| Qwen3-8b | 已适配 | MindSpeed-LLM 预置稠密大模型:参考文档,安装指导:参考文档,微调指导文档:参考文档 |
| Qwen3-32b | 已适配 | MindSpeed-LLM 预置稠密大模型:参考文档,安装指导:参考文档,微调指导文档:参考文档 |
| Qwen3-VL-32b | 已适配 | MindSpeed-MM框架微调:参考文档,llamafactory训练参考:参考文档,训练脚本:参考文档 |
| Qwen3(VL)-4B/8B | 已适配 | MindSpeed-MM强化学习:参考文档 |
| Qwen2-7B / LLaMA2-7B | 已适配 | MindSpeed-LLM 预置稠密大模型:参考文档,安装指导:参考文档,LoRA 微调:参考文档,LlaMA2-7B微调脚本:参考文档 |
| Qwen-3系列,如14B,32B;LLaMA-3.2 8B/14B | MindSpeed-LLM官网支持LLaMA3.2-1B/3B;VeRL暂不支持LLaMA-3.2 8B/14B和qwen3-14b | DAPO操作说明:参考文档,安装指南:参考文档,Qwen3-32B模型mindspeed-rl强化学习脚本:参考文档 |
| LLaMA3-8B-Instruct / LLaMA3.1-8B-Instruct | 已适配 | MindSpeed-LLM 预置稠密大模型:参考文档,LoRA 微调:参考文档,安装指导:参考文档,llamafactory训练参考:参考文档,Llamafactory框架训练脚本:参考文档 |
| DeepSeek-R1-Distill-Llama-70B 或 Llama-3-70B | 已适配 | MindSpeed LLM安装指导:参考文档,分布式预训练:参考文档,llama3-70B预训练脚本:参考文档 |
| Deepseek V3.2 | 已适配 | MindSpeed LLM安装指导:参考文档,微调脚本:参考文档,模型微调脚本:参考文档 |
| openai/gpt-oss-120b | gpt-oss-20b支持,120B暂无 | 安装指导:参考文档,操作说明:参考文档,gpt-oss-20b模型微调脚本:参考文档 |
推理
提示
部分参考文档为同框架部署指导文档,可参考。
| 模型完整名称 | 推理引擎 | 适配情况 | 参考文档 |
|---|---|---|---|
| Qwen3-VL-30B-A3B-Instruct | vLLM | 已适配 | 参考文档,参考文档 |
| qwen3-30b-a3b | vLLM | 已适配 | 参考文档 |
| Qwen3-VL 235B-A22B | vLLM | 已适配 | 参考文档 |
| Qwen3-VL-32B-Thinking | vLLM | 已适配 | 参考文档 |
| Qwen2.5-Coder-32B/14B/7B-Instruct; Qwen3-Coder-30B-A3B-Instruct | vLLM,sglang | 已适配 | 参考文档,参考文档 |
| Qwen3-8B | MindIE / vLLM | 已适配 | 参考文档,参考文档 |
| Qwen2-7B | vLLM / MindIE | 已适配 | 参考文档,参考文档 |
| Qwen/Qwen3-8B | vLLM | 已适配 | 参考文档 |
| Qwen/Qwen3-14B | vLLM | 已适配 | 参考文档 |
| Qwen/Qwen2.5-7B-Instruct | vLLM | 已适配 | 参考文档 |
| Qwen/Qwen2.5-VL-7B-Instruct | vLLM | 已适配 | 参考文档 |
| Qwen/Qwen2.5-14B-Instruct | vLLM | 已适配 | 参考文档 |
| Qwen/Qwen3-VL-Embedding-2B | vLLM | 已适配 | 参考文档 |
| Qwen/Qwen3-VL-Embedding-8B | vLLM | 已适配 | 参考文档 |
| Qwen/Qwen3-Embedding-8B | vLLM | 已适配 | 参考文档 |
| Qwen/Qwen3-Embedding-4B | vLLM | 已适配 | 参考文档 |
| Qwen/Qwen3-Embedding-0.6B | vLLM | 已适配 | 参考文档 |
| Qwen/Qwen3-235B-A22B-Thinking-2507 | liteLLM, vLLM | 已适配 | 参考文档,参考文档,参考文档 |
| Qwen3-8B | vLLM | 已适配 | 参考文档 |
| Qwen3-8B | sglang | 已适配 | 参考文档,参考文档 |
| Qwen3-8B | vLLM | 已适配 | 参考文档 |
| Qwen3-32B | vLLM | 已适配 | 参考文档 |
| Qwen3-235B | vLLM | 已适配 | 参考文档 |
| Qwen3-VL-235B | vLLM | 已适配 | 参考文档 |
| Qwen3-Omini | vLLM | 已适配 | 参考文档 |
| Qwen3(VL)-4B/8B/32B | vLLM | 已适配 | 参考文档 |
| Qwen3-235B-A22B/Qwen3-235B-A22B-W8A8 | vllm/omni_infer | 已适配 | 参考文档 |
| Wan 2.2 | 已适配 | 参考文档 | |
| DeepSeek-R1-Distill-70B (Int8/W8A8 量化版) | vLLM 或 MindIE | 已适配 | 参考文档 |
| Deepseek V3.2 | liteLLM, vLLM | 已适配 | 参考文档,参考文档,参考文档 |
| DeepSeek-V3 | vLLM | 已适配 | 参考文档 |
| Deepseekocr | vLLM | 已适配 | 参考文档 |
| Kimi-K2-Thinking | liteLLM, vLLM | 已适配 | 参考文档,参考文档,参考文档 |
| Kimi-Audio | pytorch | 已适配 | 暂无 |
| LLaMA3-8B-Instruct | MindIE | 已适配 | 参考文档 |
| openai/gpt-oss-120b | liteLLM, vLLM | 已适配 | 参考文档,参考文档,参考文档 |
| Whisper-Large-V3 | pytorch | 已适配 | 参考文档 |
| BAAI/bge-base-en-v1.5 | vLLM | TEI已适配,vllm未适配 | 参考文档 |
| BAAI/bge-large-en-v1.5 | vLLM | TEI已适配,vllm未适配 | 参考文档 |
| LLaDA2.0-flash | SgLang | 已提交模型适配团队,迁移适配中;已基于SGLang正常其服务并调用成功--1.20 | 参考文档 |
| HunyuanVideo-1.5 | 已适配 | 参考文档 | |
| speaker-diarization-3.1 | pytorch | 已适配 | 参考文档 |