
快科技 11 月 6 日消息,如今的 AI 芯片越发强大,也越发"饥渴",微软 CEO 纳德拉都感慨电力供应已经跟不上,NVIDIA 可谓难辞其咎。
根据摩根士丹利的最新报告,NVIDIA Blackwell Ultra GB300 NVL72 机架式 AI 服务器系统中,单单是液冷散热组件的价值就高达 49860 美元,约合人民币近 36 万元,这已经比 GB200 NVL72 系统高了大约 20%。
这还没完。
下一代系统的功耗将进一步增加,因此预计 Vera Rubin NVL144 服务器的液冷系统成本将再次增加 17%,达到 55170 美元,约合人民币近 40 万元。

根据这份报告,GB300 NVL72 服务器包含 18 个计算托盘,每颗 GPU 芯片功耗 1400W,每个计算托盘的功耗至少 6600W,为此需要 6200W 的散热能力,单个液冷成本约 2260 美元,18 个总计 40680 美元。
另外还有 9 个 NVSwitch 交换机托盘,单个液冷成本约 1020 美元,9 个总计 9180 美元。
不出意外,整个液冷散热系统中,最昂贵的组件是为 GPU、CPU 定制的高性能液冷板,每个要 300 美元,还有为 NVSwitch 交换机定制的冷板,每个也要 200 美元。
摩根士丹利预计,下一代 Vera CPU、Rubin GPU 的功耗会更高,其中 GPU 将高达 1800W,还有 NVSwitch 6.0 交换机也会更耗电,散热成本也就随之水涨船高。
其中,每个计算托盘的散热成本增加 18%,达到 2660 美元,其中更大容量的冷板成本增至 400 美元,而托盘总量不变,合计 47880 美元。
好消息是交换机托盘的散热成本会降低大约 15%,每个 870 美元,合计 7830 美元。

再往后的 Rubin Ultra,将会改为每个 GPU 封装内集成 4 个计算模块、16 个 HBM4E 内存模块,热设计功耗大幅提升至 3600W,从而需要新的液冷板,甚至是浸没式液冷。
同时,NVIDIA 正在准备新的 NVL576 机架方案,包含多达 144 颗 GPU,比现在多一倍,散热成本自然会急剧增加。
当然,跟我们没啥关系 ……

配资软件app提示:文章来自网络,不代表本站观点。