Skip to main content

模型适配列表(持续更新)

提示

如有其他软件/模型适配需求,请联系hpc@hkust-gz.edu.cn

推理

提示

部分参考文档为同框架部署指导文档,可参考。

模型完整名称推理引擎适配情况参考文档
Qwen3-VL-30B-A3B-InstructvLLM已适配参考文档参考文档
qwen3-30b-a3bvLLM已适配参考文档
Qwen3-VL 235B-A22BvLLM已适配参考文档
Qwen3-VL-32B-ThinkingvLLM已适配参考文档
Qwen2.5-Coder-32B/14B/7B-Instruct; Qwen3-Coder-30B-A3B-InstructvLLM,sglang已适配参考文档参考文档
Qwen3-8BMindIE / vLLM已适配参考文档参考文档
Qwen2-7BvLLM / MindIE已适配参考文档参考文档
Qwen/Qwen3-8BvLLM已适配参考文档
Qwen/Qwen3-14BvLLM已适配参考文档
Qwen/Qwen2.5-7B-InstructvLLM已适配参考文档
Qwen/Qwen2.5-VL-7B-InstructvLLM已适配参考文档
Qwen/Qwen2.5-14B-InstructvLLM已适配参考文档
Qwen/Qwen3-VL-Embedding-2BvLLM已适配参考文档
Qwen/Qwen3-VL-Embedding-8BvLLM已适配参考文档
Qwen/Qwen3-Embedding-8BvLLM已适配参考文档
Qwen/Qwen3-Embedding-4BvLLM已适配参考文档
Qwen/Qwen3-Embedding-0.6BvLLM已适配参考文档
Qwen/Qwen3-235B-A22B-Thinking-2507liteLLM, vLLM已适配参考文档参考文档参考文档
Qwen3-8BvLLM已适配参考文档
Qwen3-8Bsglang已适配参考文档参考文档
Qwen3-8BvLLM已适配参考文档
Qwen3-32BvLLM已适配参考文档
Qwen3-235BvLLM已适配参考文档
Qwen3-VL-235BvLLM已适配参考文档
Qwen3-OminivLLM已适配参考文档
Qwen3(VL)-4B/8B/32BvLLM已适配参考文档
Qwen3-235B-A22B/Qwen3-235B-A22B-W8A8vllm/omni_infer已适配参考文档
Wan 2.2已适配参考文档
DeepSeek-R1-Distill-70B (Int8/W8A8 量化版)vLLM 或 MindIE已适配参考文档
Deepseek V3.2liteLLM, vLLM已适配参考文档参考文档参考文档
DeepSeek-V3vLLM已适配参考文档
DeepseekocrvLLM已适配参考文档
Kimi-K2-ThinkingliteLLM, vLLM已适配参考文档参考文档参考文档
Kimi-Audiopytorch已适配暂无
LLaMA3-8B-InstructMindIE已适配参考文档
openai/gpt-oss-120bliteLLM, vLLM已适配参考文档参考文档参考文档
Whisper-Large-V3pytorch已适配参考文档
BAAI/bge-base-en-v1.5vLLMTEI已适配,vllm未适配参考文档
BAAI/bge-large-en-v1.5vLLMTEI已适配,vllm未适配参考文档
LLaDA2.0-flashSgLang已提交模型适配团队,迁移适配中;已基于SGLang正常其服务并调用成功--1.20参考文档
HunyuanVideo-1.5已适配参考文档
speaker-diarization-3.1pytorch已适配参考文档