财经
李飞飞团队 s1 模型基于 Qwen 训练?阿里云确认:基于 Qwen2.5-32B-Instruct 模型训练
2025-02-07 16:37  来源:
李飞飞等斯坦福大学和华盛顿大学研究人员以不到 50 美元的云计算费用训练了一个名叫 s1 的人工智能推理模型,该模型在数学和编码能力测试中的表现与 OpenAl 的 o1 和 Depsek 的 R1 等尖端推理模型类似,引发广泛关注。 不过很快,该 s1 模型被指「并非从零开始训练」,其基座模型为「阿里通义千问(Qwen)模型」。对此,新浪科技向阿里云方面求证,阿里云方面确认了这一消息,并回应称:「他们以阿里通义千问 Qwen2.5-32B-Instruct 开源模型为底座,在 16 块 H100 GPU 上监督微调 26 分钟,训练出新模型 s1-32B,取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比 o1-preview 高出 27%。」

您可能感兴趣的...
  • 特朗普:将大幅提高对印度关税
  • 2025-08-05分享热度:44...
  • #特朗普:将大幅提高对印度关税#当地时间8月4日,美国总统特朗普在其社交媒体“真实社交”发文表示,印...
坚果炒货品牌洽洽靠山姆卖掉了2亿
  • 印度软件服务巨头将裁员1.2万人
  • 2025-07-28分享热度:57...
  • 由于行业需求萎缩,TCS公司将裁减全球约2%员工,约1.2万个工作岗位。印度软件服务业巨头表示,裁员将主...
  • 央行将面临巨额逆回购到期
  • 2025-02-17分享热度:339...
  • 下周央行公开市场将有10443亿元逆回购到期,其中周一至周五分别到期2290亿元、330亿元、5580亿元、1258...
发表评论
0评