vLLM 发布 v0.9.1,支持更多模型、引入 llm-d 框架 vLLM 发布了 v0.9.1 版本,新增 Magistral 模型支持、FlexAttention 支持等多项功能,并介绍了与 Inference Gatew... admin /软件 /2025-06-19 /0 评论 /47 阅读