比肩DeepSeek-R1!阿里发布Qwen3全系列6款模型齐出,势不可挡!
大家好,欢迎来到程序视点!我是你们的老朋友.小二!
2025年4月29日,阿里巴巴集团发布开源大语言模型家族最新成员Qwen3,为AI创新树立新标杆。
Qwen3系列简介
Qwen3系列包含六款密集模型与两款混合专家模型(Mixture-of-Experts, MoE),有助开发者更灵活地开发适用于移动设备、智能眼镜、自动驾驶汽车及机器人等场景上的应用。
Qwen3全系列模型现已开源并全球上线,包含六款密集模型(参数量0.6B、1.7B、4B、8B、14B、32B)及两款MoE模型(30B总参数、3B激活参数;235B总参数、22B激活参数)。
Qwen3 开源模型核心亮点
- 模型能力全球领先
- Qwen3 系列模型性能登顶全球,旗舰版 Qwen3-235B-A22B 对标顶级闭源模型,部分指标超越 Gemini 2.5 Pro。
- 小尺寸模型(如 Qwen3-4B)性能接近上一代 Qwen-32B,MoE 模型 Qwen3-30B-A3B 全面超越 Qwen-32B。
- 首个开源混合推理模型
- 支持 普通模式(无思维链)和 推理模式(长思考),无需切换模型,开发者体验更优。
- 类似 DeepSeek V3(普通模式)和 R1(推理模式)的结合,但集成于单一模型。
- 8 个不同尺寸模型,覆盖全场景
- Qwen3-30B-A3B(总参数量 30B,激活 3B)
- Qwen3-235B-A22B(总参数量 235B,激活 22B,部署成本仅 DeepSeek R1 的 1/3)。
- 稠密模型(Dense):0.6B、1.7B、4B、8B、14B、32B,适用于不同算力需求。
- MoE 模型:
- Token 支持:0.6B~4B 支持 32K,其余支持 128K。
- 低成本、高效部署
- 旗舰模型 Qwen3-235B-A22B 推理成本极低,适合企业级应用。
- 支持 MCP 协议 & 增强 Agent 能力
- 提升任务规划与执行能力,支持多模态协作(如调用即梦 AI 画图)。
- 多语言支持大幅提升
- 支持 **119 种语言**(上一代仅 29 种),覆盖更广泛的全球用户需求。
其他
- 开源协议:Apache 2.0,可自由商用。
- Blog: https://qwenlm.github.io/blog/qwen3/ GitHub: https://github.com/QwenLM/Qwen3
- 图片
- 体验方式:
- 官方 Demo:Qwen Chat(默认旗舰版)
- 通义千问:Tongyi
- 实测表现:
- 代码生成:能生成完整的前端页面(如登录页、交互式时间线)。
- 游戏开发:可完成简单游戏(如连连看),复杂项目(如弹球游戏)略有瑕疵。
- 多模态扩展:支持与即梦 AI 结合,实现图文混排效果。
总结
Qwen3 以 高性能、低成本、全场景覆盖 为核心优势,通过混合推理、MoE 架构和多语言支持,成为当前最具竞争力的开源大模型之一。阿里此次开源诚意十足,技术突破显著,为开发者与用户提供了更灵活、高效的选择。
最后
【程序视点】助力打工人减负,从来不是说说而已!后续小二哥会继续详细分享更多实用的工具和功能。
如果这篇文章对你有帮助的话,别忘了【在看】【点赞】支持下哦~