英特尔下月开始交付第五代至强处理器,最多64核

英特尔在2023年超级计算大会上发布了一系列高性能计算(HPC)公告,包括新的至强系列和Guadi人工智能处理器。
2023-11-18 18:33:59  |   作者:开源爱好者  |   来源:

英特尔下月开始交付第五代至强处理器,最多64核

英特尔在2023年超级计算大会上发布了一系列高性能计算(HPC)公告,包括新的至强系列和Guadi人工智能处理器。
2023-11-18 18:33:59
作者:开源爱好者
来源:

英特尔发布新一代至强和Guadi处理器

图片4.jpg

英特尔在2023年超级计算大会上发布了一系列高性能计算(HPC)公告,包括新的至强系列和Guadi人工智能处理器。

英特尔将于12月14日向OEM合作伙伴交付代号为Emerald Rapids的第五代至强可扩展处理器。Emerald Rapids 的最大内核数为 64 核,比 56 核的第四代至强处理器略有增加。除了更多的内核外,Emerald Rapids 还将具有更高的频率、FP16 硬件加速,并支持 12 个内存通道,包括英特尔开发的新 MCR 内存,该内存速度大大超过常规的 DDR5 内存。

根据英特尔提供的基准测试结果,顶级的 Emerald Rapids 在人工智能语音识别方面比顶级的第四代 CPU 提高了 1.4 倍,在 FFMPEG 媒体转码工作负载方面提高了 1.2 倍。总得来说,英特尔称其在人工智能工作负载方面的性能提高了 2~3 倍,内存吞吐量提高了 2.8 倍,DeepMD+LAMMPS 人工智能推理工作负载提高了 2.9 倍。

英特尔还提供了即将推出的用于人工智能推理的Guadi 3 处理器的一些细节。Guadi 3 将是最后一款独立的 Guadi 加速器,之后英特尔会将Guadi与 GPU 技术合并成一款名为 Falcon Shores 的产品。

5nm Gaudi 3 的 BF16 工作负载性能是 Gaudi 2 的4倍,网络性能是 Gaudi 2 的2倍(Gaudi 2 有 24 个内置 100 GbE RoCE Nics),HBM 容量是 Gaudi 2 的 1.5 倍。

对于 GPU 而言,Falcon Shores 可以进行大量非图形处理。它将支持以太网交换和 CXL 编程模型。

基于至强的Aurora位列超算TOP榜第二名

世界上速度最快的超级计算机仍然是 Frontier,它是位于田纳西州能源部橡树岭国家实验室的一台全 AMD 芯片的超级计算机。但英特尔凭借同样位于能源部设施内的 Aurora 超级计算机位居第二,而且 Aurora 尚未完工。

位于阿贡领导计算设施的 Aurora 超级计算机满负荷运行时,将使用 21248 个至强 Max CPU 和 60000 个至强 Max GPU,成为世界上部署 GPU 最多的超级计算机。

英特尔尚未发布任何正式的基准测试,不过透露了其中一项测试。英特尔和阿贡共同开展了一个生成式人工智能项目,采用了 1 万亿参数的 GPT-3 LLM 基础人工智能科学模型。作为对比,ChatGPT 3.5 使用了 1750 亿个参数。

由于 GPU Max 使用了大量内存,Aurora 只需 64 个节点即可运行该模型。阿贡国家实验室在总共 256 个节点上并行运行了该模型的四个实例。英特尔表示,LLM 是一个科学 GPT,模型是在科学文献、代码和数据集上训练的,其规模超过 1 万亿个参数,这些参数来自不同的科学领域。