快讯
大模型视觉测评榜单出炉:Gemini遥遥领先 豆包冲进前三
2025-12-31 10:07  来源:快科技

12月31日消息,近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。

谷歌的Gemini-3-pro以83.64分遥遥领先,字节跳动的豆包大模型以73.15分跻身前三,展现出国内大模型的竞争力。

此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。

榜首Gemini-3-pro在三项细分指标中均表现突出,基础认知得分89.01、视觉推理82.82、视觉应用79.09,全面领先其他模型。

国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,字节跳动的豆包视觉版紧随其后,其基础认知得分82.70,甚至超过部分国际竞品,仅在视觉推理环节稍显短板。

百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五,其中Qwen3-vl是榜单中首个开源且总分超70的模型。

国际头部模型中,Anthropic的Claude-opus-4-5得分71.44,OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。

您可能感兴趣的...
  • 年收入12万以下基本无需缴税
  • 2025-07-28分享热度:91...
  • 国家税务总局副局长蔡自力介绍,从2021-2024年度个税申报数据看,年收入居前10%的群体,缴纳的个税占比...
王自如:在格力工资是以前几分之一
  • 美国取消中国小额包裹豁免
  • 2025-02-05分享热度:437...
  • 美国海关和边境保护局发布通知,自中国进口、价值低于800美元的商品的“小额豁免”被取消。
外交部回应X不被允许在中国运营
  • 支付宝回应京东接入
  • 2024-10-30分享热度:228...
  • #支付宝回应京东接入#京东商城目前已开通支付宝支付,一些用户已经顺利完成了支付。
发表评论
0评