比肩DeepSeek-R1!阿里发布Qwen3全系列6款模型齐出,势不可挡!

比肩DeepSeek-R1!阿里发布Qwen3全系列6款模型齐出,势不可挡!

精选文章moguli202025-05-25 21:50:004A+A-

大家好,欢迎来到程序视点!我是你们的老朋友.小二!

2025年4月29日,阿里巴巴集团发布开源大语言模型家族最新成员Qwen3,为AI创新树立新标杆。

Qwen3系列简介

Qwen3系列包含六款密集模型与两款混合专家模型(Mixture-of-Experts, MoE),有助开发者更灵活地开发适用于移动设备、智能眼镜、自动驾驶汽车及机器人等场景上的应用。

Qwen3全系列模型现已开源并全球上线,包含六款密集模型(参数量0.6B、1.7B、4B、8B、14B、32B)及两款MoE模型(30B总参数、3B激活参数;235B总参数、22B激活参数)。

Qwen3 开源模型核心亮点

  1. 模型能力全球领先
  2. Qwen3 系列模型性能登顶全球,旗舰版 Qwen3-235B-A22B 对标顶级闭源模型,部分指标超越 Gemini 2.5 Pro。
  3. 小尺寸模型(如 Qwen3-4B)性能接近上一代 Qwen-32B,MoE 模型 Qwen3-30B-A3B 全面超越 Qwen-32B。
  4. 首个开源混合推理模型
  5. 支持 普通模式(无思维链)和 推理模式(长思考),无需切换模型,开发者体验更优。
  6. 类似 DeepSeek V3(普通模式)和 R1(推理模式)的结合,但集成于单一模型。
  7. 8 个不同尺寸模型,覆盖全场景
  8. Qwen3-30B-A3B(总参数量 30B,激活 3B)
  9. Qwen3-235B-A22B(总参数量 235B,激活 22B,部署成本仅 DeepSeek R1 的 1/3)。
  10. 稠密模型(Dense):0.6B、1.7B、4B、8B、14B、32B,适用于不同算力需求。
  11. MoE 模型
  12. Token 支持:0.6B~4B 支持 32K,其余支持 128K。
  13. 低成本、高效部署
  14. 旗舰模型 Qwen3-235B-A22B 推理成本极低,适合企业级应用。
  15. 支持 MCP 协议 & 增强 Agent 能力
- 提升任务规划与执行能力,支持多模态协作(如调用即梦 AI 画图)。
  1. 多语言支持大幅提升
- 支持 **119 种语言**(上一代仅 29 种),覆盖更广泛的全球用户需求。![图片](https://mmbiz.qpic.cn/mmbiz_png/OjgKEXmLURrgmcHYkNoia5nWWl1FCD5YRO97pE5OmA4ryd1RETSDAg7XEVdDEKMTzp4LicwDibYNR1qM9ibYp1OIIQ/640?wx_fmt=png&from=appmsg&tp=wxpic&wxfrom=5&wx_lazy=1)

其他

  • 开源协议:Apache 2.0,可自由商用。
  • Blog: https://qwenlm.github.io/blog/qwen3/ GitHub: https://github.com/QwenLM/Qwen3
  • 图片
  • 体验方式
  • 官方 Demo:Qwen Chat(默认旗舰版)
  • 通义千问:Tongyi
  • 实测表现
  • 代码生成:能生成完整的前端页面(如登录页、交互式时间线)。
  • 游戏开发:可完成简单游戏(如连连看),复杂项目(如弹球游戏)略有瑕疵。
  • 多模态扩展:支持与即梦 AI 结合,实现图文混排效果。

总结

Qwen3 以 高性能、低成本、全场景覆盖 为核心优势,通过混合推理、MoE 架构和多语言支持,成为当前最具竞争力的开源大模型之一。阿里此次开源诚意十足,技术突破显著,为开发者与用户提供了更灵活、高效的选择。

最后

【程序视点】助力打工人减负,从来不是说说而已!后续小二哥会继续详细分享更多实用的工具和功能。

如果这篇文章对你有帮助的话,别忘了【在看】【点赞】支持下哦~

点击这里复制本文地址 以上内容由莫古技术网整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!
qrcode

莫古技术网 © All Rights Reserved.  滇ICP备2024046894号-2