快讯
DeepSeek新模型MODEL1曝光
2026-01-21 18:23  来源:TechWeb

1月21日消息,DeepSeek的下一代旗舰模型疑似提前曝光。在其官方GitHub代码库的更新中,一个名为“MODEL1”的新模型名称在多个技术文件中频繁出现,引发了人工智能社区的广泛关注。

根据对代码库的深入挖掘,“MODEL1”的踪迹横跨了114个文件,共计被提及28次。尤为关键的是,它在代码逻辑中与当前已发布的“V32”(即DeepSeek-V3.2模型)并列出现,表明它并非现有模型的简单迭代,而极有可能是一个独立的新模型序列。

技术分析显示,MODEL1与V3.2在底层架构上存在显著差异。代码对比指出,二者在KV(键值)缓存布局、稀疏性处理方式以及FP8精度解码等核心模块上采用了不同的实现方案。特别是在内存优化方面,MODEL1显示出多处针对性改进,这通常意味着它在处理效率或支持更长上下文方面可能有新的设计目标。

此前有消息称DeepSeek计划在2026年春节前后发布其下一代重量级模型。因为,不少行业分析人士认为,此次MODEL1在开源代码中意外现身,就如同之前DeepSeek发布的优化残差链接“mHC”和AI记忆模块“Engram”两篇论文中提到的新技术一样,很可能正是为这次发布进行的技术准备。

目前,DeepSeek官方尚未对此事发表任何公开评论。所有信息均来源于对公开代码的非官方分析,模型的具体技术细节、性能指标及正式名称仍需等待官方的最终揭晓。

您可能感兴趣的...
  • 年收入12万以下基本无需缴税
  • 2025-07-28分享热度:90...
  • 国家税务总局副局长蔡自力介绍,从2021-2024年度个税申报数据看,年收入居前10%的群体,缴纳的个税占比...
王自如:在格力工资是以前几分之一
  • 美国取消中国小额包裹豁免
  • 2025-02-05分享热度:437...
  • 美国海关和边境保护局发布通知,自中国进口、价值低于800美元的商品的“小额豁免”被取消。
外交部回应X不被允许在中国运营
  • 支付宝回应京东接入
  • 2024-10-30分享热度:228...
  • #支付宝回应京东接入#京东商城目前已开通支付宝支付,一些用户已经顺利完成了支付。
发表评论
0评