比肩DeepSeek-R1!阿里发布Qwen3全系列6款模型齐出，势不可挡!

精选文章moguli202025-05-25 21:50:004A⁺A^-

大家好，欢迎来到程序视点！我是你们的老朋友.小二！

2025年4月29日，阿里巴巴集团发布开源大语言模型家族最新成员Qwen3，为AI创新树立新标杆。

Qwen3系列简介

Qwen3系列包含六款密集模型与两款混合专家模型（Mixture-of-Experts, MoE），有助开发者更灵活地开发适用于移动设备、智能眼镜、自动驾驶汽车及机器人等场景上的应用。

Qwen3全系列模型现已开源并全球上线，包含六款密集模型（参数量0.6B、1.7B、4B、8B、14B、32B）及两款MoE模型（30B总参数、3B激活参数；235B总参数、22B激活参数）。

Qwen3 开源模型核心亮点

模型能力全球领先
Qwen3 系列模型性能登顶全球，旗舰版 Qwen3-235B-A22B 对标顶级闭源模型，部分指标超越 Gemini 2.5 Pro。
小尺寸模型（如 Qwen3-4B）性能接近上一代 Qwen-32B，MoE 模型 Qwen3-30B-A3B 全面超越 Qwen-32B。
首个开源混合推理模型
支持 普通模式（无思维链）和 推理模式（长思考），无需切换模型，开发者体验更优。
类似 DeepSeek V3（普通模式）和 R1（推理模式）的结合，但集成于单一模型。
8 个不同尺寸模型，覆盖全场景
Qwen3-30B-A3B（总参数量 30B，激活 3B）
Qwen3-235B-A22B（总参数量 235B，激活 22B，部署成本仅 DeepSeek R1 的 1/3）。
稠密模型（Dense）：0.6B、1.7B、4B、8B、14B、32B，适用于不同算力需求。
MoE 模型：
Token 支持：0.6B~4B 支持 32K，其余支持 128K。
低成本、高效部署
旗舰模型 Qwen3-235B-A22B 推理成本极低，适合企业级应用。
支持 MCP 协议 & 增强 Agent 能力

- 提升任务规划与执行能力，支持多模态协作（如调用即梦 AI 画图）。

多语言支持大幅提升

- 支持 **119 种语言**（上一代仅 29 种），覆盖更广泛的全球用户需求。![图片](https://mmbiz.qpic.cn/mmbiz_png/OjgKEXmLURrgmcHYkNoia5nWWl1FCD5YRO97pE5OmA4ryd1RETSDAg7XEVdDEKMTzp4LicwDibYNR1qM9ibYp1OIIQ/640?wx_fmt=png&from=appmsg&tp=wxpic&wxfrom=5&wx_lazy=1)

其他

开源协议：Apache 2.0，可自由商用。
Blog: https://qwenlm.github.io/blog/qwen3/ GitHub: https://github.com/QwenLM/Qwen3
图片
体验方式：
官方 Demo：Qwen Chat（默认旗舰版）
通义千问：Tongyi
实测表现：
代码生成：能生成完整的前端页面（如登录页、交互式时间线）。
游戏开发：可完成简单游戏（如连连看），复杂项目（如弹球游戏）略有瑕疵。
多模态扩展：支持与即梦 AI 结合，实现图文混排效果。