正文

阿里通义发布新推理模型 Qwen3-30B-A3B-Thinking-2507

admin V管理员 /2025年 /0 评论 /120 阅读

0801

此篇文章发布距今已超过84天，您需要注意文章的内容或图片是否可用！

阿里通义Qwen团队发布了新模型Qwen3-30B-A3B-Thinking-2507，这是一个中等规模的MoE模型，专注于提升“思考”能力。

该模型在过去三个月中持续优化，显著增强了推理的质量和深度。模型的主要亮点包括：

在逻辑推理、数学、科学、编码等需要深度思考的任务上性能大幅提升；
在指令遵循、工具使用、文本生成和人类偏好对齐等通用能力上表现更佳；
增强了对256K长上下文的理解能力。

根据官方发布的性能数据，该模型在AIME25、HMMT25和LiveCodeBench等多个高难度推理和编码基准测试中取得了优异成绩，部分指标甚至超过了Gemini-2.5-Flash-Thinking和Qwen3-235B-A22B Thinking。

Qwen3-30B-A3B-Thinking-2507是一个拥有305亿总参数和33亿激活参数的Causal Language Model，原生支持262,144 tokens的上下文长度。该模型仅支持思考模式，并且默认的聊天模板会自动包含<think>标签以强制模型进行思考。

模型已在Hugging Face和ModelScope上开放，并可在 Qwen Chat 上体验。

宙飒天下网

相关阅读

发表评论取消回复

评论列表（暂无评论，120人围观）

还没有评论，来说两句吧...

目录[+]

微信二维码

微信二维码

支付宝二维码