分析器/調試器/代碼分析 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Wed, 19 Mar 2025 08:40:49 +0000
zh-CN
hourly
1
196178272 -
通過降低指令緩存未命中率提高 GPU 性能
http://www.open-lab.net/zh-cn/blog/improving-gpu-performance-by-reducing-instruction-cache-misses-2/
Thu, 08 Aug 2024 02:25:26 +0000
http://www.open-lab.net/zh-cn/blog/?p=10885
Continued]]>
GPU 專為高速處理大量數據而設計。GPU 具有稱為流多處理器 (SM) 的大量計算資源,以及一系列可為其提供數據的設施:高帶寬內存、高大小數據緩存,以及在活躍的線程束用完時切換到其他線程束的能力,而不會產生任何開銷。 然而,數據乏現象可能仍會發生,許多代碼優化都集中在這個問題上。在某些情況下,SMs 不是數據乏,而是指令乏。本文介紹了對 GPU 工作負載的調查,該工作負載因指令緩存丟失而經歷了速度放慢。本文介紹了如何識別此瓶頸,以及消除瓶頸以提高性能的技術。 這項研究的起源是基因組學領域的應用程序,在該領域中,必須解決與將 DNA 樣本的小部分與參考基因組進行比對相關的許多小的獨立問題。背景是眾所周知的 Smith-Waterman 算法(但這本身對討論并不重要)。 在強大的 NVIDIA H100 Hopper GPU 上,擁有 114 個 SM…
Source
]]>
10885
-
使用 CRIU 實現 CUDA 應用程序檢查點
http://www.open-lab.net/zh-cn/blog/checkpointing-cuda-applications-with-criu/
Tue, 02 Jul 2024 05:00:48 +0000
http://www.open-lab.net/zh-cn/blog/?p=10535
Continued]]>
CUDA 的檢查點和恢復功能通過名為 cuda-checkpoint 的命令行實用程序公開,該實用程序可用于在正在運行的 Linux 進程中以透明方式檢查點和恢復 CUDA 狀態,同時也可以與開源檢查點實用程序 CRIU(用戶空間中的檢查點/恢復)相結合,以完全檢查點 CUDA 應用程序。 透明的每進程檢查點在虛擬機檢查點和應用程序驅動檢查點之間提供了一個中間地帶。每進程檢查點可與容器結合使用,檢查復雜應用程序的狀態,從而促進諸如以下用例。 CRIU(用戶空間中的檢查點/恢復)是適用于 Linux 的開源檢查點實用程序,在 NVIDIA 外部進行維護,可以檢查點和恢復進程樹。 CRIU 通過一個名為并通過檢查點和恢復與進程關聯的每個內核模式資源來運行。這些資源包括: 由于這些資源的行為由 Linux 指定,并且獨立于底層硬件,
Source
]]>
10535
-
高效的 CUDA 調試:將 NVIDIA Compute Sanitizer 與 NVIDIA 工具擴展程序結合使用并創建自定義工具
http://www.open-lab.net/zh-cn/blog/efficient-cuda-debugging-using-compute-sanitizer-with-nvtx-and-creating-custom-tools/
Wed, 27 Mar 2024 08:04:12 +0000
http://www.open-lab.net/zh-cn/blog/?p=9450
Continued]]>
NVIDIA Compute Sanitizer 是一款功能強大的工具,可以節省時間和精力,同時提高 CUDA 應用程序的可靠性和性能。在 CUDA 環境中調試代碼既具有挑戰性又耗時,尤其是在處理數千個線程時。Compute Sanitizer 可以提供幫助! 在這一系列的第一篇文章中,高效 CUDA 調試:使用 NVIDIA Compute Sanitizer 追蹤錯誤 中,我們將討論如何開始使用 Compute Sanitizer 工具,以檢查代碼中的內存泄漏和競爭條件。 在第二篇博文中,高效的 CUDA 調試:借助 NVIDIA Compute Sanitizer 實現內存初始化和線程同步。此外,我們還探討了用于檢查內存初始化和線程同步的工具。 在本文中,我們重點介紹了 Compute Sanitizer 的一些其他功能,即它與 NVIDIA 工具擴展程序 (NVTX)…
Source
]]>
9450
-
強大的著色器見解:通過 NVIDIA Nsight Graphics 使用著色器調試信息
http://www.open-lab.net/zh-cn/blog/harness-powerful-shader-insights-using-shader-debug-info-with-nvidia-nsight-graphics/
Thu, 14 Mar 2024 07:19:35 +0000
http://www.open-lab.net/zh-cn/blog/?p=9413
Continued]]>
隨著光線追蹤成為現代游戲引擎中的主要渲染技術,單個 GPU RayGen 著色器現在可以執行幀的大部分光線模擬。為了管理這種復雜程度,有必要在 HLSL 或 GLSL 源代碼級別觀察著色器性能的分解。因此,著色器分析器現在是優化光線追蹤的必備工具。 在本文中,我將向您展示如何使用 NVIDIA Nsight Graphics 的 GPU Trace Profiler 來分析低級別的著色器性能,以及如何啟用 DirectX 編譯器 (DXC) 的調試信息選項 。在整個博文中,我將使用以下縮寫: Path Tracing SDK 示例使用嵌入式著色器調試信息編譯所有著色器 () 作為 DXC 命令行選項,CMake 文件 中進行了配置。如果不需要 選項,可以從 Visual Studio 解決方案中刪除它并進行重建。 我還使用默認設置 (啟用了 Real-Time…
Source
]]>
9413
人人超碰97caoporen国产