谷歌下月上线 A3 实例将搭载英伟达 H100,可提供 26 exaFlops AI 性能,根据8 月 31 日消息,Google Cloud 在今天召开的云 Next 大会上,宣布下月上线 A3 虚拟机实例。谷歌云在今年 5 月召开的 I / O 开发者大会上宣布 A3 实例,最大的亮点在于配备英伟达 H100 Tensor Core GPU,满足生成式 AI 和大语言模型的需求。
小编此前报道,A3 实例采用了第 4 代英特尔至强可扩展处理器、2TB DDR5-4800 内存,以及 8 张英伟达 H100“Hopper”GPU,通过 NVLink 4.0 和 NVSwitch 实现了 3.6 TBps 的对分带宽。
新的 A3 超级计算机“专门用于训练和服务要求最苛刻的人工智能模型,这些模型为当今的生成人工智能和大型语言模型创新提供动力”。据介绍,这款超级计算机可以提供 26 exaFlops 的人工智能性能。
谷歌云在今天的发布会上还介绍了全新的 TPU v5e,是迄今为止最具成本效益和可访问的云 TPU。这些 TPU 或定制 ASIC 旨在加速 AI 和 ML 工作负载。
SDxCentral 报道称,TPU v5e 相比较前代,每美元的训练性能提高了一倍,每美元的推理性能提高了 2.5 倍。