因为 AI 和高功能谋略 (HPC) 的兴盛,数据中央处事负载无间激增,反过来,守旧的风冷伎俩正正在抵达其现实极限。跟着热负荷的填充和密度央求的增添,数据中央运营商正正在寻找新的热量约束伎俩。
然而,这种更改展现了该行业正在界说和测试组件牢靠性方面的广大差异。为风冷境遇同意的圭表一向都不是为了预测质料正在统统浸没正在介电流体中时的举动。鉴于架构策画和功能的新央求,老化模子、窒碍形式,以至相闭组件耐用性的基础假设等枢纽成分都必要从新推敲。
这种演变正正在重塑数据中央运营商评估组件牢靠性的式样。为增援风冷体系而同意的圭表抵达了其宗旨。但它们务必不绝生长,以应对浸醉式境遇带来的新寻事。
固然氛围冷却圭表长久以后连续指示体系策划,但浸入式冷却引入了一组差其它老化机造和质料寻事。为了跟上步骤,工程师和盛开谋略项目 (OCP)等行业集体正正在合营,凭据切实天下的浸入前提构修测试框架。这种更改革在风冷和浸入式冷却体系之间带来了差其它策画和牢靠性寻事(见图)。
浸入式冷却消逝了气流节造,但必要从根底上从新研讨本原办法、质料拔取和体系策画。守旧的风冷体系依赖于电扇和散热器,正在约束组件热策画功耗 (TDP) 方面面对着越来越大的寻事,这些功耗现正在大凡赶过 300 W,以至正在很多下一代 GPU 和 AI 加快器中赶过了枢纽的 400 W 阈值。赶过这一点,气流大凡不敷以庇护平和的处事温度。
为了弥合这一差异,很大批据中央运营商最初转向冷板冷却,它通过将液体直接轮回到最热的组件来改观热传达。然而,固然这种伎俩比氛围冷却更好地治理了更高的芯片密度题目,但冷板治理计划引入了平常的歧管、杂乱的机架级热交流器集成,并填充了板滞窒碍点,包含管道和相联败露的危险。
跟着谋略负载的不绝攀升,统统浸没(无论是单相仍是双相)正正在成为战胜氛围和冷板体系的布局和热节造的下一步。通过将供职器统统浸没正在介电流体中,浸入式冷却统统避免了气流节造。
与守旧的风冷陈设比拟,潜正在的节能大凡高达 30%,这取决于几个成分。这些成分或者包含利用的特定浸入式技艺、基线风冷体系的电源利用效能 (PUE)、天气前提以及 IT 负载的性子,从而正在最佳前提下供给或者有心义的能源效能提拔。虽然如斯,达成这些收益必要的不但仅是改造现有硬件。
棕地改造大凡面对吃紧的窒碍。很多守旧数据中央利用高架地板,这些地板的策画无法撑持浸入式槽的重量和密度。升级这些站点大凡必要高贵的布局加固以及增加浸泡所需的体系,比如热交流器、流体管道和庇护通道。
鉴于这些布局和本原办法寻事,大大批新的浸醉式扩定都陈设正在特意构修的“AI 工场”境遇中,此中地板撑持、冷却本原办法和空间组织专为浸醉式架构而策画。
正在新修项目中,浸入式冷却能够抬高机架密度和更好的热负责,但条件是本原办法是专为浸没式体系构修的。
浸入式冷却拥有显明的热上风,但也展现了守旧牢靠性框架的限度性。大大批现有圭表都是为了模仿质料正在氛围中的老化而构修的,正在这些前提下,氧化(而不是化学互相效率)是首要的窒碍驱动成分。
取而代之的是热化学降解(包含潜正在的水解、质料膨胀和渐渐浸出到流体中的增加剂)成为首要危险。跟着韶华的推移,这些化学改变会弱幼板滞功能并损害长久牢靠性。混流气体老化等测试伎俩最初策画用于模仿通过展现于二氧化硫和二氧化氮等反映性气体而出现的氛围腐化,但不再与流体境遇中起效率的切实失效机造依旧类似。