4月22日,Diamond Foundry发布技术白皮书《DF Tech Note 2604-01v10》,并同步刊发《Diamond Enables 100x AI Datacenter Cooling w/ 55x Less Water》,提出通过在芯片级集成单晶金刚石(SCD),重构热阻分布,从而 ...
|
4月22日,Diamond Foundry发布技术白皮书《DF Tech Note 2604-01v10》,并同步刊发《Diamond Enables 100x AI Datacenter Cooling w/ 55x Less Water》,提出通过在芯片级集成单晶金刚石(SCD),重构热阻分布,从而实现两相蒸发冷却直接在芯片背面发生。 白皮书给出的结论极具冲击力:冷却性能最高可提升10–100倍,同时液体流量需求可降低约55倍。 在AI芯片功耗持续攀升的背景下,这一方案直指当前数据中心最核心的物理瓶颈。随着单颗GPU功率逼近甚至突破千瓦级,传统冷板液冷路径正在失效。问题并不在于材料导热能力不够,而在于热量在芯片内部“耗散过多”,导致真正用于冷却界面的温度不足。换言之,限制散热性能的关键,不是总热阻,而是热阻的分布方式。 以Nvidia H100这类大尺寸、高功率芯片为例,当前主流冷板液冷体系的总热阻约为55 mm²·K/W。其构成为冷板对流换热、铜基板传导、TIM界面材料以及约800μm厚的硅衬底。看似已经是“最优解”的结构,实际上存在明显缺陷:温度在传导路径中逐级衰减,大部分温降发生在硅内部与界面层,最终传递到冷却界面的温度仅约69°C。 图1. 传统方案与金刚石方案在冷却界面可获得的温度对比:约69°C vs 100°C。在保持相同芯片热点温度的前提下,金刚石方案可支持超过2倍的功率水平。 这一温度区间决定了冷却方式的天花板。由于水在常压下100°C才沸腾,69°C远不足以触发相变,导致系统只能依赖单相液冷,通过水的显热升温带走热量。这种方式本质上效率有限:单位质量水的带热能力较低,必须通过大流量弥补,从而带来高能耗、高水耗以及复杂的管路系统。 白皮书进一步指出,两相冷却之所以长期停留在论文层面,并非不可实现,而是被这一“低温界面”锁死。如果要在69°C实现沸腾,必须将系统压力降至0.3 bar以下,这会带来蒸汽体积急剧膨胀、压缩比飙升以及泵浦功耗显著增加,工程上得不偿失。 针对这一核心矛盾,Diamond Foundry提出的路径并不是简单“换材料”,而是直接重构热路径。其核心工艺是将硅芯片减薄至20-30μm,并在其背面键合约600μm的单晶金刚石。由于金刚石热导率高达约2200 W/m·K,是硅的十余倍,这一结构将上游热阻大幅压缩,使整体有效热阻降至不足1 mm²·K/W。 图2. 传统硅芯片与“减薄硅 + 金刚石衬底”结构在背面表面的温度分布对比。金刚石方案表现出更高且更均匀的界面温度。 更关键的变化在于温降的“迁移”。在传统结构中,温差消耗在芯片内部;而在金刚石结构中,芯片内部几乎不再承担温降,即便在2500W级别功率下,温差也仅约3°C。这意味着绝大部分温差被“释放”到冷却界面,使芯片背面温度从传统方案的约69°C提升至87-100°C区间。 这一温度跃迁带来的是冷却机制的根本切换。当界面温度进入90°C附近区间时,在约0.7 bar的近常压条件下,水即可稳定沸腾。这使两相蒸发冷却从“高成本可行”转变为“工程上可用”。相比之下,传统方案必须依赖深度负压系统,工程复杂度与能耗成本大幅提升。 一旦相变冷却在芯片背面直接发生,其效率优势将呈现数量级跃迁。水的汽化潜热约为2260 J/g,远高于显热升温所能携带的能量。白皮书给出一组极具说服力的对比:对于500W热负载,蒸发冷却仅需约13 mL/min水蒸发即可带走热量,而传统冷板需要约710 mL/min流量,两者相差约55倍。 与此同时,两相冷却的热流密度能力也显著提升。单相冷却通常仅能支持10-100 W/cm²,而核态沸腾与喷雾冷却可达到100-1000 W/cm²,甚至更高,实现10-100倍性能提升。这意味着,不仅水耗降低,系统还具备支撑未来更高功率密度芯片的能力。 在具体实现路径上,白皮书重点分析了喷雾冷却与射流冲击两种方案。射流在局部具有较高换热能力,但空间分布不均;喷雾则通过液滴形成分布式薄膜蒸发,实现更均匀的换热,并在高热流密度下具备更高的临界热流密度(CHF)。在金刚石高导热能力的加持下,热量被快速横向扩散,使整个表面更加接近等温状态,从而进一步提升系统稳定性。 值得注意的是,金刚石不仅“提高效率”,还解决了两相冷却长期存在的工程问题。一方面,其高横向导热能力可有效抑制局部干涸引发的热点;另一方面,其与硅较好的热膨胀匹配降低了大尺寸芯片的翘曲风险,使传统厚TIM层这一低效结构变得不再必要。 在系统层面,压力窗口的选择同样关键。在对比了0.7 bar与0.25 bar两种工况后,DF指出后者虽然可以降低温度,但蒸汽体积将增加约2.6倍,压缩比大幅提升,泵浦功耗占比可能从3-8%上升至12-24%。因此,0.7 bar成为效率与复杂度之间的最佳平衡点,而这一工况正是金刚石方案所“解锁”的。 当然,两相冷却并非完全没有代价。虽然液体侧流量极低,但蒸汽侧体积流量大幅增加。例如在0.7 bar条件下,500W负载对应约30 L/min蒸汽流量,这对冷凝与气路系统提出新的设计要求。但整体来看,这一复杂度远低于深度负压体系,仍具备良好的工程可实现性。 从更宏观的视角看,这项技术的意义在于将原本属于“设施级”的蒸发冷却能力,下沉到芯片级实现。过去,数据中心依赖冷却塔、大规模水循环系统来处理热量,而芯片端只能依赖低效的单相液冷。如今,通过金刚石重构热阻分布,蒸发冷却被直接引入热源本体,热管理路径被极大缩短。 这项突破这不是渐进式优化,而是热架构的结构性变革。当冷却能力可以在芯片层级实现跃迁,数据中心的设计逻辑也将随之改变——从依赖庞大基础设施转向依赖材料与结构优化。 在算力与功耗同步扩张的时代,热管理已经从“配套问题”变为“边界问题”。Diamond Foundry所提出的方案,本质上是通过材料与结构的协同设计,重新定义了这一边界。当100倍性能与55倍节水不再只是理论推演,而成为可工程化落地的路径,数据中心冷却体系或许将迎来一次从底层逻辑出发的重构。 以上内容请谨慎参考 本文封面图源自网络,无任何商业用途 本文来源:超硬材料网 |
2026-03-30
2026-03-27
2026-03-20
2026-01-08
2025-12-09
请发表评论