互联网
DeepSeek论文登上《自然》杂志 首次披露训练R1成本
2025-09-18 14:43  来源:TechWeb

9月18日消息,据外媒报道,AI初创公司DeepSeek(深度求索)的论文登上《自然》杂志。

DeepSeek表示其强大的AI模型R1的成功并非依赖于模仿其他大型语言模型(LLM)生成的示例进行训练,这一声明是随着R1模型的同行评审版本的发布而公布的。

论文描述了DeepSeek如何增强标准的大型语言模型以应对推理任务,其补充材料首次揭示了训练R1的成本:仅为29.4万美元。这不包括DeepSeek公司在开发R1所基于的基础LLM上花费的约600万美元,但总成本仍然远低于竞争对手模型被认为花费的数千万美元。

DeepSeek表示,R1主要使用英伟达的H800芯片进行训练。

R1被认为是第一个经过同行评审过程的主要LLM。“这是一个非常受欢迎的先例”,Hugging Face的机器学习工程师刘易斯·图恩斯特尔说,他审阅了《自然》杂志的论文。“如果我们没有公开分享这一过程的大部分内容,就很难评估这些系统是否构成风险。”

自1月发布以来,DeepSeek因其与世界领先的AI应用相比,竞争优势明显、成本低廉而备受赞誉和关注。Sensor Tower称,DeepSeek推出的应用在最初的18天内获得了1600万次下载,几乎是OpenAI的ChatGPT首次发布时900万次下载量的两倍。

公开资料显示,DeepSeek成立于2023年7月,由知名量化资管巨头幻方量化创立,专注于开发先进的大语言模型(LLM)和相关技术。幻方量化的掌门人梁文锋是DeepSeek的创始人。

您可能感兴趣的...
高德地图 上线当天使用高德扫街榜用户超4000万人
2025苹果秋季新品发布会
美团筹备大学校园即时零售新项目
华为公司董事长梁华 2024年全年销售收入超过8600亿元
智慧乌镇点亮数字经济新未来
  • 智慧乌镇点亮数字经济新未来
  • 2024-11-21分享热度:729...
  • 以“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”为主题的2024年世界互联网大会...
  • GoPro宣布计划裁员约15%
  • 2024-08-20分享热度:264...
  • 曝GoPro将裁员15% 该计划将在2024财年的预计支出基础上减少约5000万美元的运营支出。
发表评论
0评