• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    高性能計算

    使用 NSight Compute 2021 . 3 優化 GPU 利用率

    NVIDIA 發布了最新的 NSight 計算 2021 . 3,它具有用于測量和建模占用率、源代碼和匯編代碼相關性的新功能,以及用于識別訪問緩存造成的瓶頸的分層屋頂線模型。

    占用率計算器

    NSight Compute 2021 . 3 添加了一個新的占用率計算器活動,幫助您了解內核的硬件資源利用率,并建模調整如何影響占用率。

    占用率是每個 SM 的活動扭曲與活動扭曲理論最大數量的比率。占用率低可能表示內核太小、工作負載不平衡或資源爭用。所有這些都會限制 GPU 上具有特定可用資源集的內核的性能。

    Screen display of the Nsight Compute Occupancy Calculator feature showing memory occupancy and GPU hardware utilization.
    圖 1 。 NSight 計算占用計算器的顯示

    命令行源頁面

    此版本添加了一個高要求的功能,允許直接從命令行從 GUI 中的源頁面訪問信息。通過使用--page source標志,用戶可以在命令行上看到源代碼行、 PTX 行或程序集行以及這些行的收集指標。

    在分析收集的數據以及編寫腳本和后期處理結果以進行進一步報告和分析時,此功能提供了額外的靈活性。

    Screen capture of accessing Nsight Compute source page output through a command line prompt.
    圖 2 。命令行源輸出功能的示例。

    分層屋頂線

    屋頂線圖表現在支持分層屋頂線,除了設備內存之外,還為 L1 和 L2 緩存添加屋頂線。您可以查看它們的內核與每個內存級別的帶寬限制有多接近,以確定它們的內核是否存在與訪問內存相關的瓶頸。

    Screen image of hierarchical roofline output graph to show that memory access is optimized, or needs optimizing.
    圖 3 . NSight 計算顯示屋頂線層次結構比較。

    其他增強功能

    進一步的功能包括更多可配置的基線比較、從 CLI 直接訪問源代碼級信息以及附加的 SSH 功能。

    有關調試和分析工具的更多信息,請注冊加入此 NVIDIA GTC 技術會話:使用最新的開發人員工具,了解 CUDA 應用程序行為、性能和優化變得更加容易

    有關更多信息,請參閱以下參考資料:

    要查看最新的教程信息,請參閱 NSight 計算視頻 NSight 計算員額

    ?
    0

    標簽

    人人超碰97caoporen国产