為慶祝 SuperComputing 2022 國際會議, NVIDIA 宣布發布 HPC 軟件開發工具包( SDK ) v22.11 。 NVIDIA 開發者計劃?的成員可以免費 下載?。
NVIDIA HPC SDK 是一套面向高性能計算( HPC )開發人員的編譯器、庫和工具。它提供了開發人員高效開發高性能應用程序所需的一切。 HPC SDK 及其組件每年都會進行多次更新,包括新功能、性能提升和其他增強。
設計用于 C 語言的異步編程++
除了通常的修復和增強之外,新的 v22.1 版本還為您提供了一個創新的stdexec
庫的預覽,該庫旨在標準化 C ++異步。該庫使開發人員能夠編寫不特定于 CPU 或 GPU 機器的高級算法代碼,從而提高了程序員的生產力和應用程序的可移植性。
stdexec
庫引入了異步調度工作的能力,這導致了比現有 C ++并行算法更好的資源利用率和性能。這實現了細粒度的執行控制、最小化延遲,甚至可以利用多 GPU /多節點系統的性能優勢。
stdexec
庫是 C++ Standardization Committee proposal 的早期實現,它使 HPC 工作負載與最合適的計算資源相匹配。這個庫有時被稱為 Senders ,它使您(開發人員)能夠精確地控制工作執行的位置和方式,最終提供可移植的并行性。
使用多節點數學庫擴展應用程序
HPC SDK 現在包含最新的 cuSOLVER 和 cuFFT 多節點功能。這些庫使用戶只需幾行代碼即可編寫可擴展到數千 GPU 的軟件應用程序。最近,多節點 FFT 已集成到 HPC 應用程序 GROMACS 中,從而提高了性能。
GROMACS 是一種分子動力學模擬軟件包,是世界上使用最多的 HPC 應用之一。從歷史上看,該應用程序只能用一個等級和一個 GPU 計算原子之間的粒子網格 Ewald ( PME )遠程力。這限制了完整模擬的多節點可伸縮性。通過集成新的多節點功能, GROMACS 現在可以在仿真中計算多個 PME 等級,從而增強了可擴展性和性能。
圖 1 顯示了這個新特性在實際科學測試用例中的性能改進。 NVIDIA Selene 集群每個節點使用 4 個 A100-SXM4 GPU 的結果表明,可擴展性從 2 個節點提高到 32 個節點,從而大大提高了性能。
術語 ns /天是指在一天的計算(經過的實時或壁時間)中可能出現的納秒( ns )模擬次數(模擬中的可變時間)。這是一個有用的衡量標準,可以用來安排你的工作或了解在給定時間段內可以實現的目標。

更多 HPC 、數學庫和并行編程資源
要開始使用stdexec
和 NVIDIA 數學庫,請在 NVIDIA 開發區免費使用 下載新的 HPC SDK 22.11 update 。
進一步了解 HPC SDK 、基于標準的并行編程的優點以及多節點 GPU-accelerated math libraries 。您也可以參考 NVIDIA HPC SDK Version 22.9 文檔?。
其他資源
- Why Standards-Based Parallel Programming Should Be in Your HPC Toolbox
- Leveraging Standards-Based Parallel Programming in HPC Applications
- Developing Accelerated Code with Standard Language Parallelism
- Multi-GPU Programming with Standard Parallel C++ (Part 1)
- Multi-GPU Programming with Standard Parallel C++ (Part 2)
- Using Fortran Standard Parallel Programming for GPU Acceleration
?