大模型视觉测评榜单出炉：Gemini遥遥领先豆包冲进前三_快讯_资讯_星元科技

快讯

大模型视觉测评榜单出炉：Gemini遥遥领先豆包冲进前三

2025-12-31 10:07 来源：快科技

12月31日消息，近日，SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。

谷歌的Gemini-3-pro以83.64分遥遥领先，字节跳动的豆包大模型以73.15分跻身前三，展现出国内大模型的竞争力。

此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。

榜首Gemini-3-pro在三项细分指标中均表现突出，基础认知得分89.01、视觉推理82.82、视觉应用79.09，全面领先其他模型。

国内阵营中，商汤科技SenseNova V6.5 Pro以75.35分位居第二，字节跳动的豆包视觉版紧随其后，其基础认知得分82.70，甚至超过部分国际竞品，仅在视觉推理环节稍显短板。

百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五，其中Qwen3-vl是榜单中首个开源且总分超70的模型。

国际头部模型中，Anthropic的Claude-opus-4-5得分71.44，OpenAI的GPT-5.2(high)仅获69.16分，排名相对靠后。

您可能感兴趣的...

一夜飙升金饰克价涨至1125元
2025-09-30分享热度:147...
国内金饰价格一夜飙升！现货黄金向上触及3850美元/盎司，续创历史新高，日内涨0.43%。

年收入12万以下基本无需缴税
2025-07-28分享热度:126...
国家税务总局副局长蔡自力介绍，从2021-2024年度个税申报数据看，年收入居前10%的群体，缴纳的个税占比...

美取消对中国芯片设计软件出口限制
2025-07-03分享热度:143...
美取消对中国芯片设计软件出口限制

王自如:在格力工资是以前几分之一
2025-06-09分享热度:379...
#王自如:在格力工资是以前几分之一#王自如本周五发布视频，同步将自己的账号修改为“王自如 AI”，宣布...

美国取消中国小额包裹豁免
2025-02-05分享热度:480...
美国海关和边境保护局发布通知，自中国进口、价值低于800美元的商品的“小额豁免”被取消。

美国邮政停收中国内地和香港的包裹
2025-02-05分享热度:438...
美国邮政当地时间2月4日公告称，将从2月4日起暂停接收来自中国内地和香港邮局的入境包裹，直至另行通知...

外交部回应X不被允许在中国运营
2025-01-21分享热度:1107...
外交部回应X不被允许在中国运营

支付宝回应京东接入
2024-10-30分享热度:241...
#支付宝回应京东接入#京东商城目前已开通支付宝支付，一些用户已经顺利完成了支付。

韩国紧急进口中国产大白菜
2024-09-26分享热度:472...
韩国政府决定从中国紧急进口大白菜。首批约16吨规模的中国产大白菜将运抵韩国

中国石化集团与中国石油集团签署无偿划转协议
2024-09-20分享热度:263...
中国石化集团与中国石油集团签署无偿划转协议，拟由国务院国资委批准通过国有股份无偿划转方式将中国石...

发表评论