托盘结构
先看拆掉液冷的:
1:GB300一共有四个GPU,两个CPU,四个Connect—X8(网卡)。
2:每个GPU周边有8个12层堆叠的HBM3e显存(专业术语是8堆栈12Hi HBM3E),因此每个GPU的显存带宽就是8*36=288GB。
3:每个CPU旁边有4个128GB带宽的SOCAMM(内存模组),共计4*128GB=512GB带宽。
液冷:
1:冷板(Cold Plates):散热的第一道防线,这些模块直接覆盖在主要的热源之上,包括GPU、CPU及内存模块。
2:分液歧管(Manifolds),在机柜内部,歧管扮演着流体分配中心的角色,它将来自主冷却回路的冷却液精确地分配到各个服务器托盘,并将回流的热液体汇集起来。其设计通常采用盲插(blind-mating)连接方式,以支持服务器的热插拔维护,极大提升了运维效率。
3:液冷管,用于输送冷却液。
4:快接头,连接冷板、服务器托盘与歧管的关键接口。这些接头必须具备无溢出(non-spill)、高可靠性的特点,并支持简便、快速的插拔操作,是整个液冷系统中最关键和最频繁操作的活动部件之一。
5:液冷的路径
CDU:液冷分配单元,主要负责在液冷系统中分配和管理冷却液体。
泵:用于为冷却液体的循环提供动力,推动液体在系统内流动。
水箱:储存冷却液体,保证系统有足够的液体进行循环冷却。
板式换热器:用于将吸收了服务器热量的冷却液体与其他冷却介质进行热量交换,使冷却液体降温,以便再次循环使用。
Cooling Tower(冷却塔)
通过与外界空气等进行热交换,将从板式换热器传来的热量散发出去,从而使用于交换的冷却介质降温,以便再次回到板式换热器参与热量交换。
六:价值量拆解(估算)
1:冷板,GB300为每个芯片配备独立冷板,单机柜含108块小冷板(72颗GPU + 36颗CPU),每块冷板价值约240美元,单机柜价值26000美元。
2:快接头,每个Tray14对,单机柜252对,大概55美元/对,单机柜价值13860美元。
3:软管1800到2000美元/柜,Manifold 28000美元/柜。
4:CDU,30000美元,每机柜配置一个。
七:液冷检测设备
英伟达出货之前都要进行老化检测,老化测试设备和托盘几乎一样,需要提前根据英伟达给的数据进行开发定制,这一块目前只有淳中科技。