Nvidia宣布推出下一代GPU Blackwell Ultra

英伟达还发布了搭载Blackwell Ultra和Blackwell GPU的新款数据中心及桌面系统。
2025-03-20 18:28:14  |   作者:开源爱好者  |   来源:

Nvidia宣布推出下一代GPU Blackwell Ultra

英伟达还发布了搭载Blackwell Ultra和Blackwell GPU的新款数据中心及桌面系统。
2025-03-20 18:28:14
作者:开源爱好者
来源:

英伟达于周三发布了名为Blackwell Ultra的下一代GPU,并宣布推出基于该芯片组的新系统。

Nvidia超大规模和高性能计算副总裁Ian Buck在媒体电话会议上表示,Blackwell Ultra GPU已投入生产,将接替当前名为Blackwell的GPU。

图片23.jpg

这款新GPU在英伟达本周于加州圣何塞举办的GTC大会上发布。

英伟达未透露Blackwell Ultra的具体发货日期,但表示搭载该GPU的系统将于今年晚些时候上市。

Moor Insights and Strategy副总裁兼首席分析师Anshel Sag指出,Blackwell Ultra的基础架构设计与 Blackwell相似,但通过增加内存容量和对芯片的AI优化实现了渐进式性能提升。

Sag表示:“这意味着相同任务可能减少GPU使用量,甚至在最基础的层面上,单个GPU就能运行更大的模型。”

为推理时代设计

Buck称,Blackwell Ultra GPU专为“推理时代”打造。他援引DeepSeek模型说,该模型相较于早期仅能输出结果的基于知识的模型,DeepSeek能通过额外推理步骤提供更优结果。

“推理模型的工作方式不同。当被问及一个复杂问题时,它们不会立即回答,而是先生成数千甚至上万个思考令牌(thinking tokens),再得出结论。”Buck解释道。

Buck强调,Blackwell Ultra是首款配备288GB HBM3e内存的GPU,而当前Blackwell GPU的总内存容量为192GB HBM3e。

新GPU在FP4推理性能上较Blackwell快1.5倍。FP4数据类型是一种低精度推理方案,可在降低功耗和内存需求的同时加速AI响应。

英伟达GPU支持从FP4到FP64的数据类型。FP64精度更高但能耗和时间成本也更大。英伟达未提供其他数据类型的基准测试结果。

Sag认为,FP4虽能展现Blackwell Ultra的最佳性能,但无法全面反映其芯片实力:“英伟达迫切希望推广FP4,因为这对该公司在算力层面极具优势。”

Blackwell Ultra数据中心与桌面系统发布

英伟达还推出了搭载Blackwell Ultra和Blackwell GPU的数据中心及桌面系统:

GB300 NVL72服务器系统,整合72颗Blackwell Ultra GPU和36颗自研Grace CPU,是对去年开始发货的Blackwell架构NVL72服务器的升级。

Buck表示:“我们优化了NVL72设计以提升能效和可维护性。”

该机架将提供1.1 exaflops的FP4推理性能和20 TB HBM3e内存(前代GB200 NVL72为13.5 TB)。

DGX SuperPod集群通过DGX B300系统联网构建,集群包含576颗Blackwell Ultra GPU和300颗Grace CPU。

Dell宣布将在其服务器(含GB300 NVL72)中支持Blackwell Ultra GPU。

基础设施产品组与电信业务高级营销副总裁Varun Chhabra在另一场简报中称:“我们预计(GPU)性能将达到前几代Nvidia加速器的两倍。”

Nvidia同时发布搭载Blackwell Ultra和Blackwell的工作站、台式机及笔记本:集成GB300超级芯片(Grace CPU + Blackwell Ultra GPU),提供20 petaflops AI性能和784GB统一系统内存,华硕、Boxx、戴尔、惠普、Lambda和超微等厂商将于今年晚些时候发货。

Buck称这款曾用代号“Project Digits”的设备为“全球最小AI超级计算机”。系统搭载GB10超级芯片(Grace CPU + Blackwell GPU)和128GB统一内存,戴尔、惠普、联想等公司将在年内推出品牌版本。

Nvidia还宣布,PC制造商将推出搭载其RTX Pro GPU的笔记本和台式机。