阿里推出全新推理模型：仅1/21参数媲美DeepSeek R1_互联网_资讯_星元科技

互联网

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R1

2025-03-06 11:41 来源：快科技

3月6日消息，阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。

这是一款拥有320亿参数的模型，其性能可与具备6710亿参数（其中370亿被激活）的DeepSeek-R1媲美。

QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下，用强化学习实现了性能上的跨越。

此外，阿里还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。

QwQ-32B 在一系列基准测试中进行了评估，测试了数学推理、编程能力和通用能力。

其中，在测试数学能力的AIME24评测集上，以及评估代码能力的LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

同时，在由meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFeval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek- R1。

目前，QwQ-32B已在Hugging Face和ModelScope开源，大家也可通过Qwen Chat直接进行体验！（随心）

您可能感兴趣的...

高德地图上线当天使用高德扫街榜用户超4000万人
2025-09-11分享热度:225...
“高德扫街榜”是全球首个基于行为+信用的榜单产品，对商家进行综合评分、排名，涵盖美食、景点、酒店等...

2025苹果秋季新品发布会
2025-08-29分享热度:185...
2025年秋季苹果公司举行的产品发布会活动

美团筹备大学校园即时零售新项目
2025-08-02分享热度:199...
美团正在筹备针对大学校园场景的即时零售新项目“校园mini仓”，在校园内或周边设立小型闪电仓，覆盖零...

传京东6800底薪招外卖员知情人回应
2025-02-17分享热度:149...
#传京东6800底薪招外卖员知情人回应#今日，关于京东外卖“6800元底薪+五险一金”招外卖员的传闻，京东...

华为公司董事长梁华 2024年全年销售收入超过8600亿元
2025-02-05分享热度:748...
在广东省高质量发展大会上，华为公司董事长梁华全年销售收入超过8600亿元。

智慧乌镇点亮数字经济新未来
2024-11-21分享热度:850...
以“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”为主题的2024年世界互联网大会...

智能手表销量TOP5品牌华为智能手表位列第一
2024-10-30分享热度:312...
智能手表销量前五的品牌分别是华为、苹果、小米、荣耀和vivo，TOP5品牌共占据了67.5%的市场份额。

《三角洲行动》9月26日正式上线
2024-09-24分享热度:312...
《三角洲行动》9月26日正式上线，最大亮点为融合多种射击游戏模式。

华为市场份额跃升至28.4% 首次超过苹果iPad
2024-08-29分享热度:1093...
IDC数据显示，2024年第二季度中国平板电脑市场出货量为720万台，出货量第一名是华为，市场份额28.4%。

GoPro宣布计划裁员约15%
2024-08-20分享热度:308...
曝GoPro将裁员15% 该计划将在2024财年的预计支出基础上减少约5000万美元的运营支出。

发表评论