DeepSeek论文登上《自然》杂志首次披露训练R1成本_互联网_资讯

DeepSeek论文登上《自然》杂志首次披露训练R1成本

2025-09-18 14:43 来源：TechWeb

9月18日消息，据外媒报道，AI初创公司DeepSeek（深度求索）的论文登上《自然》杂志。

DeepSeek表示其强大的AI模型R1的成功并非依赖于模仿其他大型语言模型（LLM）生成的示例进行训练，这一声明是随着R1模型的同行评审版本的发布而公布的。

论文描述了DeepSeek如何增强标准的大型语言模型以应对推理任务，其补充材料首次揭示了训练R1的成本：仅为29.4万美元。这不包括DeepSeek公司在开发R1所基于的基础LLM上花费的约600万美元，但总成本仍然远低于竞争对手模型被认为花费的数千万美元。

DeepSeek表示，R1主要使用英伟达的H800芯片进行训练。

R1被认为是第一个经过同行评审过程的主要LLM。“这是一个非常受欢迎的先例”，Hugging Face的机器学习工程师刘易斯·图恩斯特尔说，他审阅了《自然》杂志的论文。“如果我们没有公开分享这一过程的大部分内容，就很难评估这些系统是否构成风险。”

自1月发布以来，DeepSeek因其与世界领先的AI应用相比，竞争优势明显、成本低廉而备受赞誉和关注。Sensor Tower称，DeepSeek推出的应用在最初的18天内获得了1600万次下载，几乎是OpenAI的ChatGPT首次发布时900万次下载量的两倍。

公开资料显示，DeepSeek成立于2023年7月，由知名量化资管巨头幻方量化创立，专注于开发先进的大语言模型（LLM）和相关技术。幻方量化的掌门人梁文锋是DeepSeek的创始人。

您可能感兴趣的...