Nvidia宣布推出下一代GPU Blackwell Ultra
Nvidia宣布推出下一代GPU Blackwell Ultra
作者:开源爱好者
来源:
英伟达于周三发布了名为Blackwell Ultra的下一代GPU,并宣布推出基于该芯片组的新系统。 Nvidia超大规模和高性能计算副总裁Ian Buck在媒体电话会议上表示,Blackwell Ultra GPU已投入生产,将接替当前名为Blackwell的GPU。 这款新GPU在英伟达本周于加州圣何塞举办的GTC大会上发布。 英伟达未透露Blackwell Ultra的具体发货日期,但表示搭载该GPU的系统将于今年晚些时候上市。 Moor Insights and Strategy副总裁兼首席分析师Anshel Sag指出,Blackwell Ultra的基础架构设计与 Blackwell相似,但通过增加内存容量和对芯片的AI优化实现了渐进式性能提升。 Sag表示:“这意味着相同任务可能减少GPU使用量,甚至在最基础的层面上,单个GPU就能运行更大的模型。” 为推理时代设计 Buck称,Blackwell Ultra GPU专为“推理时代”打造。他援引DeepSeek模型说,该模型相较于早期仅能输出结果的基于知识的模型,DeepSeek能通过额外推理步骤提供更优结果。 “推理模型的工作方式不同。当被问及一个复杂问题时,它们不会立即回答,而是先生成数千甚至上万个思考令牌(thinking tokens),再得出结论。”Buck解释道。 Buck强调,Blackwell Ultra是首款配备288GB HBM3e内存的GPU,而当前Blackwell GPU的总内存容量为192GB HBM3e。 新GPU在FP4推理性能上较Blackwell快1.5倍。FP4数据类型是一种低精度推理方案,可在降低功耗和内存需求的同时加速AI响应。 英伟达GPU支持从FP4到FP64的数据类型。FP64精度更高但能耗和时间成本也更大。英伟达未提供其他数据类型的基准测试结果。 Sag认为,FP4虽能展现Blackwell Ultra的最佳性能,但无法全面反映其芯片实力:“英伟达迫切希望推广FP4,因为这对该公司在算力层面极具优势。” Blackwell Ultra数据中心与桌面系统发布 英伟达还推出了搭载Blackwell Ultra和Blackwell GPU的数据中心及桌面系统: GB300 NVL72服务器系统,整合72颗Blackwell Ultra GPU和36颗自研Grace CPU,是对去年开始发货的Blackwell架构NVL72服务器的升级。 Buck表示:“我们优化了NVL72设计以提升能效和可维护性。” 该机架将提供1.1 exaflops的FP4推理性能和20 TB HBM3e内存(前代GB200 NVL72为13.5 TB)。 DGX SuperPod集群通过DGX B300系统联网构建,集群包含576颗Blackwell Ultra GPU和300颗Grace CPU。 Dell宣布将在其服务器(含GB300 NVL72)中支持Blackwell Ultra GPU。 基础设施产品组与电信业务高级营销副总裁Varun Chhabra在另一场简报中称:“我们预计(GPU)性能将达到前几代Nvidia加速器的两倍。” Nvidia同时发布搭载Blackwell Ultra和Blackwell的工作站、台式机及笔记本:集成GB300超级芯片(Grace CPU + Blackwell Ultra GPU),提供20 petaflops AI性能和784GB统一系统内存,华硕、Boxx、戴尔、惠普、Lambda和超微等厂商将于今年晚些时候发货。 Buck称这款曾用代号“Project Digits”的设备为“全球最小AI超级计算机”。系统搭载GB10超级芯片(Grace CPU + Blackwell GPU)和128GB统一内存,戴尔、惠普、联想等公司将在年内推出品牌版本。 Nvidia还宣布,PC制造商将推出搭载其RTX Pro GPU的笔记本和台式机。 |