互联网
大模型从Grok-0到Grok-3 马斯克旗下xAI仅用了18个月
2025-02-18 17:31  来源:TechWeb

2月18日消息,据外媒报道,马斯克领导的人工智能初创公司xAI,在今日中午发布了他们Grok系列新一代的大语言模型Grok-3。

从外媒的报道来看,xAI新发布的Grok-3大模型,预训练在今年1月初就已完成,仍在持续改进中。

就xAI在发布中公布的消息来看,Grok-3有Grok-3和Grok-3 mini两个版本,在数学、科学、编码等测试中,都强于此前已发布的其他主流大模型,包括OpenAI o3 mini、OpenAI o1、DeepSeek R1、谷歌Gemini-2。

Grok-3和Grok-3 mini多方面的能力超过OpenAI o3 mini、DeepSeek R1等,也同马斯克此前公布的消息一致。上周在迪拜的一次峰会上宣布Grok-3将在未来一到两周发布时,马斯克就曾透露Grok 3有非常强的推理能力,在他们内部已进行的测试中,超过了其他任何已推出的大语言模型。而在当地时间周日宣布Grok-3的发布时间时,马斯克也在社交媒体上表示Grok 3将是地球上最聪明的人工智能。

对于新发布的Grok-3,外媒在报道中还提到是在超过10万块英伟达H100上训练的,xAI也已开始部署英伟达更先进的B100,性能是H100的4倍。

随着Grok-3的发布,xAI的Grok系列大模型也就来到了第四代。

xAI是在2023年的7月12日宣布成立的,在成立次月的18日,他们就在官网宣布完成了首个旗舰大模型Grok-0的训练,有330亿参数;同年11月3日,他们宣布了Grok-1模型;在去年8月13日,他们推出了推理能力更强的Grok-2,更小但能力不俗的Grok-2 mini也在当天一并推出。

从2023年8月18日宣布完成Grok-0,到今日发布Grok-3,中间仅间隔18个月,距他们宣布成立也不到20个月。

而除了Grok-0、Grok-1、Grok-2和Grok-3,xAI在去年3月28日和4月12日还曾分别推出Grok-1.5、Grok-1.5V,前者增加了长文本能力,后者则是增加了视觉能力,可以根据交错的自然语言和图像进行推理。

随着Grok-3的推出和更多算力芯片的到位,xAI在大模型的研发上也就有了更强的能力,他们后续也还将推出更多能力更强的大模型。(海蓝)

您可能感兴趣的...
高德地图 上线当天使用高德扫街榜用户超4000万人
2025苹果秋季新品发布会
美团筹备大学校园即时零售新项目
华为公司董事长梁华 2024年全年销售收入超过8600亿元
智慧乌镇点亮数字经济新未来
  • 智慧乌镇点亮数字经济新未来
  • 2024-11-21分享热度:735...
  • 以“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”为主题的2024年世界互联网大会...
  • GoPro宣布计划裁员约15%
  • 2024-08-20分享热度:269...
  • 曝GoPro将裁员15% 该计划将在2024财年的预计支出基础上减少约5000万美元的运营支出。
发表评论
0评