數據中心是現代企業的重要組成部分,但它們需要高昂的能源成本。更為復雜的是,能源成本正在上升,對數據中心的需求持續擴大,預計從 2023 年到 2030 年,市場規模將增長 25% 。
在全球范圍內,能源成本已經對數據中心和高性能計算( HPC )系統。為了減輕能源成本負擔,數據中心管理人員正在推遲購買新系統,限制當前系統的功能,甚至減少運營時間。由于成本和需求的復合增長,必須盡快找到替代能源或盡可能經濟高效地提高能源效率。
在這篇文章中,我們討論了降低數據中心能耗的四種實用策略。通過實施這些策略,您可以降低能源成本,提高數據中心的性能和可靠性。最終,這些策略只是提高您的環境、社會和治理( ESG )投資吸引力的第一步,這是全球投資者日益重視的問題。
在深入研究之前,我們要注意的是,能源效率只是實現可持續發展的一步。目前,數據中心的能源效率處于可持續性計算,計算機、芯片和其他技術的設計、制造、使用和處置,以實現對環境的凈零影響。
有關使用人工智能實現可持續計算的更多信息,請參閱在端到端 AI 世界中最大化組織的可持續性和成功的三種策略GTC 與 NVIDIA 加速計算首席技術官 Steve Oberlin 的會談。
以下是一些基于技術的因素和操作注意事項,以最大限度地提高數據中心的能源效率:
- 加速計算
- 日程安排和集裝箱
- 高效冷卻
加速計算
“世界對數據中心的需求將增長。這對世界來說是一個真正的問題。我們應該做的第一件事是:為了可持續計算的好處,世界上的每個數據中心,無論你決定做什么,盡可能加快速度.”
NVIDIA 創始人兼首席執行官黃仁勛
摩爾定律是指集成電路中晶體管的數量以及計算機的速度和能力大約每兩年翻一番。然而,隨著晶體管的速度在 2009 年左右停止增長,這一歷史趨勢已經結束。
現在,隨著摩爾定律的頻率優勢逐漸減弱,單線程性能已經達到了一個平穩期。軟件工具供應商不得不尋求其他方法來提高性能。
行業領導者正在轉向并行和 GPU 供電加速計算他們將這些策略視為通過最大化能源效率在數據中心功率包絡上限內最大化性能的明確解決方案。
加速計算也是實現數據中心能源效率的最具成本效益的方法。通過使用專用硬件,如 GPU 和DPUs,為了比通用 CPU 更快、更有效地執行某些常見的復雜計算,數據中心可以用更少的能量執行更多的計算。這減少了能源消耗和解決時間,還降低了每次計算的碳足跡。
節能硬件
節能硬件是加速計算領域的核心部分,也是任何可持續計算戰略的有力投資
例如,像直接芯片到芯片( C2C )數據傳輸路徑這樣的高速互連提供了處理核心之間的直接存儲器訪問。例如, NVIDIA Grace Hopper 將 NVIDIA 格雷斯 CPU 和 NVIDIA Hopper H100 GPU 與 900GB / s 互連配對,實現快速的直接數據傳輸,并確保 GPU ‘始終得到充分利用。這樣可以最大限度地減少執行工作負載所消耗的能量。
當您為數據中心選擇新硬件時,在進行選擇時必須考慮效率和性能。然而,并非所有節能技術都能提供卓越的性能。
幸運的是,新一波全棧、數據中心規模、節能的硬件可用于各種各樣的用例。 NVIDIA 格雷斯 CPU 、 NVIDIA Grace Hopper 和 NVIDIA BlueField -3 是用于超節能加速數據中心的新芯片。
主流應用程序正在看到節能性能比 x86 提高 2 倍。僅 NVIDIA Grace CPU 就提供了微服務、分析、模擬等。
日程安排和集裝箱
容器化是一個軟件部署過程,它將應用程序的代碼與在任何基礎設施上運行所需的所有文件和庫捆綁在一起。
雖然集裝箱化和調度可能不適用于超級計算中心和HPC在大多數情況下都是滿負荷運行的工作負載,這對于企業工作負載來說是一個有價值的能效解決方案。
數據中心可以通過將應用程序及其依賴關系封裝在輕量級、隔離的容器中來實現更高的資源利用率。容器能夠對資源分配進行細粒度控制,使您能夠為每個應用程序或服務僅分配必要的 CPU 、內存和存儲資源。
這種有效的資源利用轉化為減少了能源消耗,因為不必要的資源沒有被分配或浪費。容器化還可以實現應用程序的快速部署、擴展和遷移,從而提高數據中心資源的靈活性和優化利用率。
調度機制和技術對于最大限度地提高數據中心的能源效率至關重要。高級調度算法,如工作負載感知和功率感知調度器,既考慮了應用程序的計算需求,也考慮了可用資源,以做出智能調度決策。通過在服務器上戰略性地放置和整合工作負載,調度算法可以確保資源的高效利用。這最大限度地減少了未充分利用或閑置服務器造成的能源浪費。
動態功率管理技術,如功率封頂和頻率縮放,可以集成到調度算法中,通過基于工作負載需求動態調整服務器的功率使用來優化能耗。通過使用智能調度機制,數據中心可以實現更高的資源利用率,降低能源消耗,從而提高能源效率。
高效冷卻
平均冷卻系統消耗的電量占數據中心總電量的 40% ,令人垂涎欲滴。這種能量消耗量使得這樣的系統成為作為能效戰略的一部分的目標的首要任務:
- 引導熱通道和冷通道安全殼
- 優化氣流管理
- 使用高效冷卻技術,如直接液體冷卻( DLC )
在熱通道/冷通道控制的情況下,來自空調系統的冷空氣被引入冷通道,而來自服務器和其他設備的熱空氣被引入熱通道。這有助于確保冷空氣不會浪費在熱設備上,從而最大限度地減少能量損失。
除了熱通道/冷通道控制外,還應優化氣流管理,以降低功耗。通過監測服務器和其他 IT 設備之間的氣流,可以識別并消除潛在的堵塞,這將有助于確保冷空氣有效地到達數據中心的所有區域。此外,這種做法有助于保持整個設施的安全溫度,防止因滯留的熱空氣而形成熱點。
最后, DLC 等高效冷卻技術可以極大地降低數據中心的能源消耗。直接液體冷卻使直接接觸電子元件(如 CPU 和 GPU )的液體循環,以更有效地散熱。這使 DLC 能夠提供一些節能優勢,如改善傳熱、減少氣流需求、有針對性的冷卻和廢熱再利用。
節能數據中心設計和運營的最佳實踐
當前的數據中心發展時期提供了一個獨特的機會,可以通過優先考慮數據中心的能源效率,引領潮流走向更可持續的未來。通過實施四大戰略,最大限度地提高數據中心的能源效率,您可以減少碳足跡,節省運營成本,并將您的組織定位為可持續計算領域的領導者。
但這不僅僅是眼前的好處。通過采用可持續的計算實踐,您還可以使您的組織經得起未來考驗,以應對日益增長的環境責任和實現 ESG 目標的需求。
隨著越來越多的客戶和利益相關者將可持續性放在首位,您對能源效率和可持續計算的承諾可以幫助您吸引和留住頂尖人才。它還可以幫助您與客戶建立更牢固的關系,并將您的組織定位為一個負責任、具有前瞻性思維的領導者。
因此,當您考慮最大限度地提高數據中心能源效率的前四種方法時,請記住,這不僅僅是一種節約成本的措施。這是一個對地球產生積極影響、建立一個更強大、更有韌性的組織、為所有人創造更美好未來的機會。
有關能效和能效解決方案的更多信息,請參閱NVIDIA Sustainable Computing Resources Center.
?