• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    數據科學

    CUDA 工具包 12.3 為加速計算提供新功能

    ?

    NVIDIA DLSS 技術的最新版本使用最新的 NVIDIA GPU,通過 CUDA 工具包 繼續推動加速計算性能的發展。此版本的新功能,版本 12.3 包括:

    CUDA 和 CUDA 工具包繼續為數據科學、機器學習和深度學習、使用 LLM 進行訓練和推理、圖形和仿真以及科學計算等領域的所有加速計算應用提供基礎。CUDA 對于幫助解決世界上最復雜的計算問題至關重要。

    NVIDIA Nsight 開發者工具

    最新版本的 NVIDIA Nsight 開發者工具 已包含在 CUDA 工具包中,可幫助您在 GPU 上優化和調試 CUDA 應用程序,適用于NVIDIA Grace Hopper 平臺。

    Nsight 計算

    Nsight 計算 為 CUDA 內核提供詳細的分析和分析,版本 2023.3 隨 CUDA 工具包 12.3 首次亮相。此版本包含可提高性能以及數據收集和分析能力的功能。

    新的 PM Sampling 功能添加了與時間相關的內核性能數據。以前,大多數性能指標是在整個內核中聚合的。這個經常請求的功能可以幫助用戶發現內核中相位和時間效應(如尾部效應)中出現的性能問題(圖 1)。它包含在--full指標集。可以將其添加為 GUI 中的 PM 采樣部分,也可以通過添加--section PmSampling標志到 CLI.

    Screenshot of Nsight Compute kernel profiler.
    圖 1.Nsight 計算 PM 采樣

    Nsight Compute 2023.3 還引入了比較不同配置文件中源代碼更改的功能,以了解修改對源級別性能的影響。要使用此功能,請將一份報告設置為基準,然后單擊另一份報告中的“Source Comparison”(源比較)按鈕,查看突出顯示的源差異和相關性能指標。

    使用–-lineinfo編譯核函數以啟用源分辨率時,以及源文件是否已就地修改時,使用“Import Source”(導入源文件)選項或--import-source以保留原始源代碼。

    如需詳細了解 Nsight Compute 2023.3 功能,請參閱 Nsight Compute 入門

    Nsight Systems

    CUDA 工具包 12.3 還包含 Nsight Systems 2023.3,這是一款性能調整工具,可在統一的時間軸上分析硬件指標以及 CUDA 應用、API 和庫。

    最新版本的 Nsight Systems 引入了對 NVIDIA Grace CPU 的支持,您可以根據應用程序的性能深入了解 Grace CPU 周期。Nsight Systems 2023.3 還添加了新功能,包括來自 GUI 的網絡接口卡 (NIC) 分析。

    作為數據在服務器硬件單元之間移動的主要方式,了解網絡中的節點間通信將有助于診斷瓶頸。Nsight Systems 會監控 NIC 吞吐量,繪制發送和接收的字節量圖表。延長的 NIC 等待時間有力地表明節點間網絡需要優化。Nsight Systems 還可以分析 NVIDIA Quantum InfiniBand 交換機吞吐量。

    如需詳細了解 Nsight Systems 2023.3 的功能,請參閱 Nsight Systems 入門。如需更深入地了解 Nsight Systems 如何支持數據中心規模的開發,請參閱借助 NVIDIA Nsight Systems 加速數據中心和 HPC 性能分析

    總結

    CUDA 工具包 12.3 版本豐富了用于加速計算的基礎 NVIDIA 驅動程序和運行時軟件,同時繼續為最新的 NVIDIA GPU、加速庫、編譯器和開發者工具提供增強支持。

    如需了解詳情,請參閱 CUDA 文檔,查看最新的 NVIDIA 深度學習培訓中心 (DLI),并瀏覽 NGC 目錄,提出問題并加入對話 CUDA 開發者論壇。

    ?

    +1

    標簽

    人人超碰97caoporen国产