• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    數據中心/云端

    NVIDIA Grace CPU 與 Arm 軟件生態系統集成

    NVIDIA Grace CPU 將節能高效的性能提升到了新的高度,正在改變數據中心的設計。Grace CPU 專為數據中心規模打造,旨在處理要求嚴苛的工作負載,同時降低功耗。

    NVIDIA 相信利用 GPU 加速各種工作負載的好處。但是,并非所有工作負載都得到加速。對于涉及復雜的分支代碼 (例如圖形分析) 的工作負載尤其如此,這些代碼通常用于欺詐檢測、運營優化和社交網絡分析等熱門用例。

    隨著數據中心面臨越來越大的功率限制,加速盡可能多的工作負載并在盡可能高效的計算上運行其余工作負載變得至關重要。Grace CPU 經過優化,可處理加速任務和僅使用 CPU 的任務,在功耗與傳統 CPU 相同的情況下提供高達 2 倍的性能。

    Grace CPU 配備 72 個高性能、高能效的 Arm Neoverse V2 核心,由 NVIDIA Scalable Coherency Fabric (SCF) 連接。這種高帶寬結構可確保在 CPU 核心、緩存、內存和系統 I/O 之間實現流暢的數據流,并提供高達 3.2 TB/s 的對分帶寬,是傳統 CPU 帶寬的兩倍。

    Grace CPU 還采用具有服務器級可靠性的高速 LPDDR5X 內存,提供高達 500 GB/s 的內存帶寬,而能耗僅為傳統 DDR 內存的五分之一。

    在本文中,我們想分享 Grace CPU 如何在現有 Arm 生態系統的基礎上構建,同時利用大量 NVIDIA 軟件和工具。

    標準軟件基礎架構

    Grace CPU 被設計為平衡型通用 CPU,與其他 CPU 一樣工作。在 Grace CPU 上運行軟件的工作流與在任何 x86 CPU 上使用的工作流相同。標準 Linux 發行版 (Ubuntu、RHEL、SLES 等) 和任何多平臺開源編譯器 (GCC、LLVM 等) 都支持 Grace CPU。

    如今,大多數開源軟件已經支持 Arm,因此 Grace CPU 也支持這些軟件。同樣,在 Grace CPU 上完成的任何軟件優化和移植也適用于 Arm Neoverse 軟件生態系統的其余部分。

    NVIDIA 將繼續與 Arm 生態系統中的開發者和合作伙伴合作,并致力于確保開源編譯器、庫、框架、工具和應用充分利用基于 Arm Neoverse 的 CPU (例如 Grace CPU)。

    許多云原生和商用 ISV 應用已經為 Arm 提供了優化的可執行文件。Arm 開發者中心展示了適用于 AI、云、數據中心、5G、網絡和邊緣的精選軟件包。該中心還提供了有關 如何將應用程序遷移到 Arm 的指導

    此生態系統由 Arm 標準提供支持,例如 Arm Server Base System Architecture(SBSA)和 Arm SystemReady 認證計劃的 Base Boot Requirements(BBR)。

    NVIDIA 軟件支持 Arm 生態系統

    數十年來,Arm 一直在軟件生態系統方面進行投資。您可以不斷創新,并且知道該軟件不僅有效,還針對 Arm 進行了優化:NVIDIA 軟件生態系統還利用數十年來在加速計算方面的工作成果,現已針對 Arm 進行了優化:

    • NVIDIA HPC SDK 和每個 CUDA 組件都具有 Arm 原生安裝程序和 容器
    • NVIDIA 容器生態系統的 NVIDIA NIM 微服務和 NGC 提供深度學習、機器學習和 HPC 容器,優化為 Arm。NVIDIA NIM 可增強推理性能,實現高吞吐量和低延遲的大規模 AI。

    NVIDIA 還在擴展面向 Arm CPU 的軟件生態系統。NVIDIA 之前為 Arm CPU 推出了一套新的高性能數學庫,稱為 NVIDIA Performance Libraries (NVPL)。這些庫實現了標準 API,因此在鏈接階段采用這些 API 可以輕松替代 x86,

    同樣, Arm 的性能庫(ArmPL) 等數學庫也進行了調整,以更大限度地提高 Grace CPU 以及任何其他 Arm CPU 的性能。例如,Arm 分享了如何以與 x86 類似的方式使用 ArmPL Sparse。ArmPL 具有與 x86 數學庫類似的 API ,這意味著開發包裝器只需要更改代碼中的幾個 API 即可。

    NVIDIA 積極參與開源軟件社區,例如 GCC 和 LLVM 編譯器社區。如果您不想等待這些常規版本的發布,并且想要構建在 Grace CPU 上以最佳性能執行的代碼,您還可以通過 Clang 發行版獲得最新的優化。

    將您的軟件無縫遷移到 Arm

    Arm 軟件生態系統規模龐大且不斷發展,已有數百個開源項目和商業 ISV 支持 Arm 架構。如果應用程序尚不受支持,您可能需要重新編譯源代碼。有多種工具可幫助您實現這一目標:

    有關應用程序移植和優化的更多信息,請參閱 NVIDIA Grace Performance Tuning Guide 。其中包含有關在 NVIDIA Grace CPU 上設置和優化性能的說明。它還為開發者提供有關 Arm SIMD 編程、Arm 內存模型和其他詳細信息的高級指導。使用本指南幫助您實現特定 NVIDIA Grace 系統的最佳性能。

    A diagram shows an arrow with four steps: Reuse (NGC, Linux distros); ID Dependencies & Recompile (GCC, LLVM, NVIDIA Compiler, Spack or EasyBuild); Run (high-core count, threads-per-process, update tests); and Optimize (NVPL, NVIDIA Nsight, ArmPL/ArmCL, Arm Forge, Perf, PAPI, TAU, Score-P, and so on).
    圖 1、在 Grace CPU 上運行軟件會使用與任何其他 CPU 相同的流程進行優化

    總結?

    NVIDIA Grace CPU 專為現代數據中心而設計,擁有 72 個高性能 Arm Neoverse V2 核心,這是 NVIDIA 設計的高帶寬 SCF,可更大限度地提高性能和高帶寬低功耗內存。與領先的傳統 x86 CPU 相比,它可以在相同的功率范圍內提供高達 2 倍的性能。

    NVIDIA Grace CPU 是基于標準的 Arm SBSA 設計,其工作方式與任何其他 CPU 相同,并且與廣泛的 Arm 軟件生態系統完全兼容。

    有關軟件和系統設置的更多信息,請參閱 NVIDIA Grace CPU

    ?

    0

    標簽

    人人超碰97caoporen国产