• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    模擬/建模/設計

    使用新的 Nsight Compute 改進導航和性能可視化

    ?

    NVIDIA Nsight Compute 是一款用于 CUDA 應用程序的交互式內核分析器。它通過用戶界面和命令行工具提供詳細的性能指標和 API 調試。 Nsight Compute 2022.2 包含擴展支持的環境和工作流程的功能,用于 CUDA 內核評測和優化。

    立即下載。>>

    以下概述了 Nsight Compute 2022.2 的功能亮點。

    NVIDIA OptiX 加速結構查看器

    使用新的 NVIDIA OptiX acceleration structure viewer ,用戶可以在啟動光線跟蹤管道之前檢查他們構建的結構。加速結構描述渲染場景的幾何體,用于光線跟蹤交點計算。用戶創建這些加速結構, OptiX 將其轉換為內部數據結構。有時,用戶創建的描述很容易出錯,很難理解渲染結果為什么不符合預期,或者是什么限制了性能。

    有了這個新功能,用戶可以在三維可視化工具中瀏覽它們,并查看創建過程中使用的參數,如構建標志、三角形網格頂點和 AABB 坐標。此查看器可用于識別重疊或低效的層次結構,從而產生亞像素光線跟蹤性能。

    Nsight Compute Acceleration Structure Viewer provides 3D Scene Navigation and metrics]
    圖 1 :。帶 3D 場景導航的 Nsight Compute acceleration structure viewer

    每個內核的問題檢測

    最新版本在摘要頁面中添加了一個新的“檢測到的問題”列,用戶可以根據檢測到的性能問題的數量對所有分析的內核進行排序。這為用戶提供了在多個結果(內核配置文件)中集中精力的指導。如果用戶不確定要將優化工作集中在哪個內核上,那么一個長時間運行且檢測到大量問題的內核是一個很好的起點。

    The Issues Detected Column in the Summary Page identifies kernels with the most performance issues
    圖 2 :。摘要頁面中的“檢測到的問題”列標識性能問題最多的內核

    其他改進

    源頁面上的度量分組和選擇選項有改進,使其更易于使用。此外,此版本還增加了對在基于 ARM SBSA 和 L4T 的平臺上運行 Nsight Compute 用戶界面的支持,用戶無需遠程連接或單獨的主機即可進行配置。

    查看以下 NVIDIA GTC 2022 發布的課程,展示 Nsight 工具功能、對 Jetson Orin 的支持等。

    Nsight 計算資源

    ?

    0

    標簽

    人人超碰97caoporen国产