如果要用一个词来形容当下的AI大模型圈,“DeepSeek速度”或许是最精准的概括。距离DeepSeek V4震撼发布尚不足5天,官方不仅上演了令人咋舌的“三轮连降”价格战,其后续的重磅技术布局也已悄然浮出水面——补齐V4家族最后一块核心拼图的“满血多模态版”,已正式进入倒计时。
官方亲自剧透,原生视觉能力即将解锁
近日,DeepSeek多模态研发团队的核心研究员陈小康在社交平台X上公开发文,明确预告了“新版DeepSeek V4”的即将到来。在当前的语境下,这个“新版”几乎毫无悬念地指向了外界翘首以盼的多模态版本。
事实上,自V4发布以来,业界对其最大的探讨与些许遗憾,皆在于其首发仅推出了Flash(快速)与Pro(专家)两款纯文本大模型。在如今的大模型竞技场,纯文本能力固然是底层基石,但“原生多模态能力”早已成为问鼎顶级梯队的入场券。缺乏对图像、视频等视觉信息的原生理解,意味着在诸多复杂真实场景中,模型的上限会被死死锁住。此次多模态版的呼之欲出,正是DeepSeek补齐这一关键短板的利刃。
APP端早埋伏笔:不拼榜分,只拼“性价比”
敏锐的用户其实早已发现,在近期DeepSeek客户端的迭代中,模型选择栏里悄然新增了“快速”、“专家”以及“视觉”三个独立选项。前两者精准对应V4的Flash和Pro,而一直处于待命状态的“视觉”选项,无疑正是为即将上线的新版多模态V4预留的接口。
至于这款满血多模态V4的硬核实力能达到什么段位?目前虽无定论,但参照V4 Pro在纯文本领域展现出的统治级表现,业界普遍预测其视觉处理能力至少将稳居行业“第一梯队”。
不过,对于一向不走寻常路的DeepSeek来说,盲目追逐跑分榜单的“第一名”或许从来不是首要目标。“把多模态大模型的价格打下来,让更多开发者和普通用户用得起”,才是其真正的杀手锏。 如果DeepSeek能将多模态API的调用成本再次拉降到“白菜价”,引发的下一次行业洗牌将比三轮降价来得更加猛烈。





