阿里最新开源推理模型发布:性能比肩DeepSeek-R1

精选文章moguli202025-03-23 19:25:0412A⁺A^-

3月6日凌晨，阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1，同时大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。QwQ-32B采用了Apache 2.0开源协议，目前，所有人都可免费下载及商用QwQ-32B模型，或通过网页版Qwen Chat进行体验，该模型也将免费上架通义APP。

阿里通义团队表示，QwQ-32B模型拥有320亿参数，其性能可与具备6710亿参数（其中370亿被激活）的DeepSeek-R1媲美。在冷启动的基础上，模型针对数学和编程任务、通用能力分别进行了两轮大规模强化学习，在32B的模型尺寸上获得了令人惊喜的推理能力提升，印证了大规模强化学习可显著提高模型性能。（澎湃新闻记者胡含嫣）

(本文来自澎湃新闻，更多原创资讯请下载“澎湃新闻”APP)

点击这里复制本文地址以上内容由莫古技术网整理呈现，请务必在转载分享时注明本文地址！如对内容有疑问，请联系我们，谢谢！

apache 2.2 下载

上一篇：joomla未授权到RCE

下一篇：干货 | 这 3 个超经典的Linux实战项目，让你分分钟入门Linux系统

阿里最新开源推理模型发布:性能比肩DeepSeek-R1

相关文章