互联网
亚马逊云科技推出配备72个英伟达Blackwell GPU的新实例 算力提升20倍
2025-07-10 16:28  来源:TechWeb

7月10日消息,为了加速推理模型、Agentic AI系统等新兴生成式AI技术的发展,亚马逊云科技宣布由NVIDIA Grace Blackwell Superchips加速的_Amazon EC2 P6e-GB200 UltraServer_现已正式可用。P6e-GB200 UltraServer专为训练和部署最大规模、最复杂的AI模型而设计。

今年早些时候,亚马逊云科技已推出了基于NVIDIA Blackwell GPU的Amazon EC2 P6-B200实例,支持多样化的AI和高性能计算工作负载。

Amazon EC2 P6e-GB200 UltraServer是亚马逊云科技迄今为止最强大的GPU产品,配备最多72个NVIDIA Blackwell GPU,这些GPU通过第五代NVIDIA NVlink互连,并作为单一计算单元运行。每台UltraServer可提供高达360 petaflops的高密度FP8算力,以及13.4TB的高带宽显存(HBM3e)——相比P5en实例,在单个NVlink域内的计算能力提升超过20倍,内存容量提升超过11倍。Amazon EC2 P6e-GB200 UltraServer支持高达28.8 Tbps的第四代Elastic Fabric Adapter(EFAv4)网络带宽。

Amazon EC2 P6-B200实例为广泛AI场景提供灵活选择。每个实例配备8个通过NVlink互连的NVIDIA Blackwell GPU,拥有1.4TB高带宽显存和最高3.2 Tbps的EFAv4网络带宽,以及第五代Intel Xeon Scalable处理器。与Amazon EC2 P5en实例相比,Amazon EC2 P6-B200实例的GPU计算能力是其2.25倍,显存容量为其1.27倍,显存带宽为其1.6倍。

目前,亚马逊云科技通过多种部署路径简化Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200实例的启用过程,客户可快速开始使用Blackwell GPU,同时保持其现有的运维模式。

Amazon SageMaker HyperPod将支持Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200实例,并通过优化使工作负载保持在同一NVlink域内,以实现性能最大化。亚马逊云科技还在构建一套完整的多层级恢复机制:Amazon SageMaker HyperPod可在同一NVlink域内自动用预配置的备用实例替换故障节点。内置仪表板将提供从GPU利用率、内存使用情况到工作负载指标和UltraServer运行状态的全面可视化信息。

同时,Amazon EC2 P6e-GB200 UltraServer也将通过NVIDIA DGX Cloud提供。DGX Cloud是一个统一的AI平台,在各层架构均经过优化,具备多节点AI训练与推理能力,并集成英伟达完整的AI软件栈。客户可充分利用英伟达最新的性能优化方案、基准测试方法和技术专长,以提升效率与性能。该平台还提供灵活的服务期限选择,以及由英伟达专家提供的全面支持与服务,助力客户加速推进AI项目。

您可能感兴趣的...
高德地图 上线当天使用高德扫街榜用户超4000万人
2025苹果秋季新品发布会
美团筹备大学校园即时零售新项目
华为公司董事长梁华 2024年全年销售收入超过8600亿元
智慧乌镇点亮数字经济新未来
  • 智慧乌镇点亮数字经济新未来
  • 2024-11-21分享热度:840...
  • 以“拥抱以人为本、智能向善的数字未来——携手构建网络空间命运共同体”为主题的2024年世界互联网大会...
  • GoPro宣布计划裁员约15%
  • 2024-08-20分享热度:306...
  • 曝GoPro将裁员15% 该计划将在2024财年的预计支出基础上减少约5000万美元的运营支出。
发表评论
0评