国产AI大模型GLM-5.1登顶开源第一：可独立编程8小时_互联网_资讯_星元科技

互联网

国产AI大模型GLM-5.1登顶开源第一：可独立编程8小时

2026-04-10 19:53 来源：快科技

4月10日消息，3月底智谱正式推出了GLM-5.1大模型，编程能力评分45.3分，号称比全球最强的Opus 4.6只低了2.6分。

前两天GLM-5.1大模型也正式开源，也深受开发者喜爱，现在最新的排名也来了——全球权威AI评测平台LMArena（百万用户参与盲测）更新Code Arena专项榜单，GLM-5.1登顶全球开源模型第一，位列全球模型第三。

除了榜单表现优秀，根据智谱的说法，GLM-5.1不仅继承了上一代模型的开源SOTA编码能力，还在长程任务（Long-Horizon Task）上取得突破，实现了：

·8小时从零构建Linux桌面

·655次迭代打破向量数据库优化瓶颈

·1000轮工具调用优化真实机器学习模型负载

值得一提的是，在METR榜单的同等评估标准下，GLM-5.1是唯一达到8小时级持续工作的开源模型，也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。

此前智谱提到，GLM-5.1大大提高了代码能力，在完成长程任务方面提升尤为显著。

在最接近真实软件开发的SWE-bench Pro基准测试中，GLM-5.1刷新全球最佳成绩，超过GPT-5.4、Claude Opus 4.6。SWE-Bench Pro要求模型在真实GitHub仓库中定位并修复高难度工程Bug，是衡量模型能否胜任专业软件开发的最硬指标。

您可能感兴趣的...

中小商家如何开通高德商户通？效果怎么样？
2026-04-17分享热度:171...
商户通是高德地图推出的针对中小商家的推广产品，主要包括展示页面、广告形式、价格、功能和效果本地...

高德地图上线当天使用高德扫街榜用户超4000万人
2025-09-11分享热度:418...
“高德扫街榜”是全球首个基于行为+信用的榜单产品，对商家进行综合评分、排名，涵盖美食、景点、酒店等...

2025苹果秋季新品发布会
2025-08-29分享热度:338...
2025年秋季苹果公司举行的产品发布会活动

美团筹备大学校园即时零售新项目
2025-08-02分享热度:386...
美团正在筹备针对大学校园场景的即时零售新项目“校园mini仓”，在校园内或周边设立小型闪电仓，覆盖零...

传京东6800底薪招外卖员知情人回应
2025-02-17分享热度:220...
#传京东6800底薪招外卖员知情人回应#今日，关于京东外卖“6800元底薪+五险一金”招外卖员的传闻，京东...

华为公司董事长梁华 2024年全年销售收入超过8600亿元
2025-02-05分享热度:953...
在广东省高质量发展大会上，华为公司董事长梁华全年销售收入超过8600亿元。

智慧乌镇点亮数字经济新未来
2024-11-21分享热度:1021...
以“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”为主题的2024年世界互联网大会...

智能手表销量TOP5品牌华为智能手表位列第一
2024-10-30分享热度:392...
智能手表销量前五的品牌分别是华为、苹果、小米、荣耀和vivo，TOP5品牌共占据了67.5%的市场份额。

《三角洲行动》9月26日正式上线
2024-09-24分享热度:388...
《三角洲行动》9月26日正式上线，最大亮点为融合多种射击游戏模式。

华为市场份额跃升至28.4% 首次超过苹果iPad
2024-08-29分享热度:1246...
IDC数据显示，2024年第二季度中国平板电脑市场出货量为720万台，出货量第一名是华为，市场份额28.4%。

发表评论