模型支持情况¶

随着智能算力的快速迭代，我们已经支持了多种模型的推理服务，您可以在这里看到所支持的模型信息。

Note

推理能力的支持与智能算力的版本有关，请查阅 Release Notes 了解最新版本并及时更新。

您可以在智能算力中使用经过 DCE 5.0 验证过的 GPU 类型；更多细节参阅 GPU 支持矩阵。

点击创建

Triton Inference Server¶

通过 Triton Inference Server 可以很好的支持传统的深度学习模型，我们目前支持主流的推理后端服务：

Backend	支持模型格式	介绍
pytorch	TorchScript、PyTorch 2.0 格式的模型	triton-inference-server/pytorch_backend
tensorflow	TensorFlow 2.x	triton-inference-server/tensorflow_backend
vLLM(Deprecated)	与 vLLM 一致	支持的模型和 vLLM support Model 一致

Danger

使用 Triton 的 Backend vLLM 的方式已被弃用，推荐使用最新支持 vLLM 来部署您的大语言模型。

通过 vLLM 我们可以很快的使用大语言模型，您可以在这里看到我们支持的模型列表，这通常和 vLLM Support Models 保持一致。

目前，智能算力还支持在使用 vLLM 作为推理工具时的一些新特性：