互联网
阿里通义Qwen3:推理模型升级,数学与编程能力飞跃
2025-07-31 17:51  来源:TechWeb

7月31日消息,人工智能领域再掀热潮。

阿里通义近日推出的推理模型新版本Qwen3-30B-A3B-Thinking-2507,实现了数学推理和代码能力的关键性提升。根据最新报道,该模型在数学推理评测AIME25中取得了85.0分的高分,同时在代码能力测试LiveCodeBench v6中也以66.0分的成绩,显著超越了包括Gemini2.5-Flash(thinking)和旧款旗舰Qwen3-235B在内的竞争对手。

这款名为通义Qwen3的新推理模型不仅在知识水平评测(GPQA、MMLU-Pro)上展示了明显的进步,还在写作能力(WritingBench)、Agent执行能力(BFCL-v3),以及多轮对话和多语言指令处理(MultiIF)等综合能力上表现出显著优势。通过一系列的测试数据比较,Qwen3的综合性能已经超越了同类产品的标准水平。

此次模型升级的特色之一是显著增加了思考长度,这大大提升了模型在面对复杂任务时的处理能力。开发者现在可以利用这一特性,通过延长模型的思考时间,来挖掘其在逻辑推理和多步骤问题解决方面的潜力。

阿里通义已经将这一先进模型在魔搭社区和HuggingFace上开源,同时推出的Qwen Chat智能对话平台也将为用户带来更流畅和高效的交互体验。这一技术进步不仅代表了通义千问在专用推理模型领域的重要突破,也为全球开发者社区贡献了一个更加强大的AI工具。(Suky)

您可能感兴趣的...
高德地图 上线当天使用高德扫街榜用户超4000万人
2025苹果秋季新品发布会
美团筹备大学校园即时零售新项目
华为公司董事长梁华 2024年全年销售收入超过8600亿元
智慧乌镇点亮数字经济新未来
  • 智慧乌镇点亮数字经济新未来
  • 2024-11-21分享热度:727...
  • 以“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”为主题的2024年世界互联网大会...
  • GoPro宣布计划裁员约15%
  • 2024-08-20分享热度:263...
  • 曝GoPro将裁员15% 该计划将在2024财年的预计支出基础上减少约5000万美元的运营支出。
发表评论
0评