NVIDIA 發布了最新的 NSight 計算 2021 . 3,它具有用于測量和建模占用率、源代碼和匯編代碼相關性的新功能,以及用于識別訪問緩存造成的瓶頸的分層屋頂線模型。
占用率計算器
NSight Compute 2021 . 3 添加了一個新的占用率計算器活動,幫助您了解內核的硬件資源利用率,并建模調整如何影響占用率。
占用率是每個 SM 的活動扭曲與活動扭曲理論最大數量的比率。占用率低可能表示內核太小、工作負載不平衡或資源爭用。所有這些都會限制 GPU 上具有特定可用資源集的內核的性能。
命令行源頁面
此版本添加了一個高要求的功能,允許直接從命令行從 GUI 中的源頁面訪問信息。通過使用--page source
標志,用戶可以在命令行上看到源代碼行、 PTX 行或程序集行以及這些行的收集指標。
在分析收集的數據以及編寫腳本和后期處理結果以進行進一步報告和分析時,此功能提供了額外的靈活性。
分層屋頂線
屋頂線圖表現在支持分層屋頂線,除了設備內存之外,還為 L1 和 L2 緩存添加屋頂線。您可以查看它們的內核與每個內存級別的帶寬限制有多接近,以確定它們的內核是否存在與訪問內存相關的瓶頸。
其他增強功能
進一步的功能包括更多可配置的基線比較、從 CLI 直接訪問源代碼級信息以及附加的 SSH 功能。
有關調試和分析工具的更多信息,請注冊加入此 NVIDIA GTC 技術會話:使用最新的開發人員工具,了解 CUDA 應用程序行為、性能和優化變得更加容易。
有關更多信息,請參閱以下參考資料:
- NVIDIA NSight 計算乘積第頁
- NVIDIA NSight 計算文檔
- NSight 計算開發人員工具論壇
- ARM 開發總結會話:使用最新的 NSight 開發工具簡化 ARM 上 CUDA 的 HPC 開發
- 以前的 GTC 會議:
要查看最新的教程信息,請參閱 NSight 計算視頻和 NSight 計算員額。
?