• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    數據中心/云端

    聚焦:東京大學使用 NVIDIA Grace Hopper 進行開創性的節能地震研究

    超級計算機是推動突破性發現的引擎。從預測極端天氣到推進疾病研究,以及設計更安全、更高效的基礎設施,這些機器可以模擬因規模、成本和材料要求而無法在現實世界中進行測試的復雜系統。

    自 1999 年推出 GPU 以來,NVIDIA 一直在不斷突破加速 計算的極限 ,這種方法使用專業硬件,通過在并行處理中捆綁頻繁出現的任務來大幅加速工作。這種效率使超級計算機能夠處理前所未有的計算挑戰,同時減少每項任務消耗的能源。

    如今,由 NVIDIA 提供支持的系統在高效超級計算領域處于領先地位,在 Green500 榜單前 10 名中有 8 名入選,而 Green500 榜單是高效超級計算機的行業基準測試。德國于利希超級計算中心(Jülich Supercomputing Center)的 JEDI 系統由 NVIDIA Grace Hopper 提供動力支持,充分體現了這一進步,實現了 72.7 gigaflops 每瓦的驚人效率。

    與東京大學一起推進地震安全性

    NVIDIA 和東京大學最近的研究工作就是這種 提高能效的做法的典范 。日本位于世界上地震最活躍的地區之一,需要進行尖端研究來減輕地震的影響。

    東京大學地震研究所 使用 NVIDIA Grace Hopper 超級芯片 加速地震模擬, 取得了突破性成果

    NVIDIA GH200 Grace Hopper 超級芯片采用緊密合的 CPU-GPU 架構 ,模擬性能提高了 86 倍,能效比傳統方法高 32 倍。高級內存優化可確保更快速、更復雜的計算,使研究人員能夠以出色的精度對抗震基礎設施進行建模。通過利用數據驅動的預測和異構計算系統,該大學正在幫助將地震研究轉變為更高效的工作。

    獲獎研究:用于地震建模的異構計算

    WACCPD 2024 大會上,東京大學展示了 NVIDIA 硬件與軟件的協同作用如何為動態、大規模問題提供解決方案,展示了這些突破性成果。在地震建模中,Grace Hopper 的創新架構將用于密集型計算的高性能 GPU 與用于預測算法的 CPU 內存容量相結合,從而加速基于時間進化方程的模擬。

    除了地震研究之外,這種方法還有可能重塑 高性能計算(HPC) 的能效。

    這項突破性的工作開發了一種新的 CPU-GPU 異構計算方法,能夠以有保證的準確性反復解決時間演進偏微分方程 (PDE) 問題。這種新方法通過利用 CPU 的大內存容量和 GPU 的高計算性能,實現了極短的解決方案時間 (TTS) 和低能耗的解決方案。當擴展到 Alps 超級計算機 時,該方法的速度比僅使用 CPU 快 51.6 倍,比 GPU 快 6.98 倍,同時在 1,920 個計算節點中實現了 94.3% 的驚人效率。

    Bar chart comparison of NVIDIA GH200 system performance using both CPU and GPU with baseline method using only CPU or GPU.
    圖 1、新開發的 PDE 求解器的性能比較。在 NVIDIA GH200 Grace Hopper 超級芯片中同時使用 CPU 和 GPU 可實現出色性能

    模擬涉及逐步推進時間,即通過求解方程組來計算每個時間點的解 (例如地震活動)。反過來,在每個時間步長中,都需要進行多次迭代,使解收到適當準確的結果。每次迭代的計算都非常密集,需要 GPU 的計算能力。

    因此,有兩個方面決定整體 TTS (以及相應的解能量):在每個時間步長下每次迭代的計算速度,以及每個時間步長下需要進行多少次迭代。正是這種組合使 Grace Hopper 架構真正表現出色:Hopper GPU 執行每次計算的速度極快,而 Grace CPU 的大內存容量則存儲先前結果的歷史記錄以告知預測器,從而大幅減少迭代次數。

    這種數據驅動的方法非常適合 NVIDIA GH200 Grace Hopper 超級芯片。所需的迭代次數取決于對解的初始“猜測”的準確性。這項工作的新穎之處在于,之前時間步長的數據可用于更大限度地提高每個初始解決方案的準確性,從而減少所需的迭代次數。此方法需要結合以下功能:

    • NVIDIA Grace CPU 的大內存容量可容納所需的先前時間步長數據,
    • Hopper 在每次迭代中求解方程的計算能力
    • 快速互連允許 Grace CPU 的數據驅動結果優化 Hopper GPU 上的求解器迭代次數。
    Diagram with Grace CPU on the left and Hopper GPU on the right, with arrows between predictors (left) and solvers (right) showing the ping-pong approach where the Grace CPU uses previous timestep results to predict the solution of the following step. Once completed the prediction is transferred via C2C to the GPU for the computational heavy lifting. This approach eliminates about ? of the iteration time.
    圖 2、數據驅動方法通過使用 GH200 上的高帶寬 CPU-GPU 連接將預測從 CPU 傳輸到 GPU 上的求解器,同時解決兩個問題集
    A comparison of the iteration time history of relative error of the numerical method. Two sets of lines are shown, one for the baseline method which requires about 150 iterations to get to machine zero where the data-driven predictor method requires about 50 iterations because it starts from a much lower solver error.
    圖 3、在 Grace CPU 上運行的數據驅動預測器可將迭代次數從大約 150 次減少到 50 次

    圖 1 顯示了這些優勢,與僅使用 CPU 相比,解決時間縮短了 86 倍,與僅使用 GPU 相比,縮短了 9 倍。相應的能耗分別為 32 倍 (與 CPU 相比) 和 7 倍 (僅與 GPU 相比)。

    實現高能效超級計算

    東京大學的地震研究取得的突破凸顯了高效超級計算的變革力量。通過利用 NVIDIA Grace Hopper Superchip,研究人員不僅以前所未有的利潤加速地震模擬,而且還大幅降低了能源消耗,這是 可持續計算 的關鍵一步。

    這項合作展示了尖端技術如何應對緊迫的全球性挑戰 (例如地震安全性),同時為性能和能效設定新的基準。隨著這些創新繼續在各行各業中推廣,它們為高性能計算推動科學進步和承擔環保責任的未來鋪平道路。

    NVIDIA GTC 2025 上,東京大學地震研究所副教授 Kohei Fujita 將在名為“Implement Accelerated PDE-Based Time-History Simulation by Data-Driven Methods on Strongly Coupled CPU-GPU systems”的會議中討論這項突破性研究[S72925]。

    ?

    0

    標簽

    人人超碰97caoporen国产