NSight – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Wed, 19 Mar 2025 08:40:52 +0000
zh-CN
hourly
1
196178272 -
NVIDIA 全面轉向開源 GPU 內核模塊
http://www.open-lab.net/zh-cn/blog/nvidia-transitions-fully-towards-open-source-gpu-kernel-modules/
Wed, 17 Jul 2024 04:30:48 +0000
http://www.open-lab.net/zh-cn/blog/?p=10641
Continued]]>
借助 R515 驅動程序,NVIDIA 于 2022 年 5 月發布了一套開源的 Linux GPU 內核 模塊,該模塊采用雙許可證,即 GPL 和 MIT 許可。初始版本主要面向數據中心計算 GPU,而 GeForce 和工作站 GPU 則處于 Alpha 狀態。 當時,我們宣布,在后續版本中將提供更可靠、功能齊全的 GeForce 和工作站 Linux 支持, NVIDIA 開放內核模塊最終將取代閉源驅動。 NVIDIA GPU 具有通用的驅動架構和功能集。這意味著同一驅動適用于您的臺式機或筆記本電腦,也可在云端運行世界上最先進的 AI 工作負載。對我們來說,正確的選擇非常重要。 兩年過去了,我們利用開源的 GPU 內核模塊實現了與原來的應用程序性能相當或更好的性能,并添加了大量新的功能。 現在,我們處于完全過渡到開源 GPU 內核模塊的時刻,這是正確的做法。
Source
]]>
10641
-
測量多流工作負載的 GPU 占用率
http://www.open-lab.net/zh-cn/blog/measuring-the-gpu-occupancy-of-multi-stream-workloads/
Fri, 19 Apr 2024 05:40:40 +0000
http://www.open-lab.net/zh-cn/blog/?p=9671
Continued]]>
隨著新一代產品的推出, NVIDIA GPU 的性能也變得越來越強大。這種提升通常有兩種形式。每個流多處理器 (SM) (GPU 的主力) 都可以更快地執行指令,而內存系統可以以越來越快的速度向 SM 傳輸數據。 與此同時,SM 的數量通常也會隨著每一代的增加而增加,這增加了 GPU 可以支持的計算并發量。例如, NVIDIA Volta、 NVIDIA Ampere 和 NVIDIA Hopper GPU 分別支持 80、108 和 132 個 SM。 在某些情況下,不斷增長的并發可能會帶來一個挑戰。在 GPU 上運行的工作負載必須公開相應的并發級別,才能使 GPU 資源得到充分利用。為此,一種常見的方法是使用多個流向 GPU 發送獨立的任務,或者類似地,使用 CUDA 的多進程服務。 本文介紹了一種確定這些方法是否成功占用 GPU 的方法。
Source
]]>
9671
-
高效的 CUDA 調試:將 NVIDIA Compute Sanitizer 與 NVIDIA 工具擴展程序結合使用并創建自定義工具
http://www.open-lab.net/zh-cn/blog/efficient-cuda-debugging-using-compute-sanitizer-with-nvtx-and-creating-custom-tools/
Wed, 27 Mar 2024 08:04:12 +0000
http://www.open-lab.net/zh-cn/blog/?p=9450
Continued]]>
NVIDIA Compute Sanitizer 是一款功能強大的工具,可以節省時間和精力,同時提高 CUDA 應用程序的可靠性和性能。在 CUDA 環境中調試代碼既具有挑戰性又耗時,尤其是在處理數千個線程時。Compute Sanitizer 可以提供幫助! 在這一系列的第一篇文章中,高效 CUDA 調試:使用 NVIDIA Compute Sanitizer 追蹤錯誤 中,我們將討論如何開始使用 Compute Sanitizer 工具,以檢查代碼中的內存泄漏和競爭條件。 在第二篇博文中,高效的 CUDA 調試:借助 NVIDIA Compute Sanitizer 實現內存初始化和線程同步。此外,我們還探討了用于檢查內存初始化和線程同步的工具。 在本文中,我們重點介紹了 Compute Sanitizer 的一些其他功能,即它與 NVIDIA 工具擴展程序 (NVTX)…
Source
]]>
9450
-
在加速計算時代構建高性能應用
http://www.open-lab.net/zh-cn/blog/building-high-performance-applications-in-the-era-of-accelerated-computing/
Mon, 25 Mar 2024 08:58:53 +0000
http://www.open-lab.net/zh-cn/blog/?p=9484
Continued]]>
AI 正在通過新的數據處理、模擬和建模方法增強高性能計算 (HPC).由于這些新 AI 工作負載的計算需求,HPC 正在快速擴展。 為了使應用程序能夠擴展到多 GPU 和多節點平臺,HPC 工具和庫必須支持這種增長。 NVIDIA 提供加速 HPC 軟件解決方案的全面生態系統,幫助您的應用程序滿足現代 AI 驅動工作負載的需求。 除了問題修復和改進 HPC 編譯器的編譯時性能之外,HPC SDK 24.3 提供新功能,支持最新的 NVIDIA Grace Hopper 系統。 在使用 OpenMP Target Offload 指令進行 GPU 編程時,NVIDIA HPC 編譯器提供統一的內存編譯模式。這增加了對 OpenACC 中 Grace Hopper 和 HMM 系統統一內存的現有支持,以及 CUDA Fortran 和 標準并行度(stdpar) 編程模型,
Source
]]>
9484
-
升級顯卡:探索 NVIDIA Nsight 工具的全新光線追蹤功能
http://www.open-lab.net/zh-cn/blog/upgrade-your-graphics-explore-new-ray-tracing-features-for-nvidia-nsight-tools/
Thu, 21 Mar 2024 09:35:25 +0000
http://www.open-lab.net/zh-cn/blog/?p=9497
Continued]]>
光線追蹤和 AI 的結合正在將圖形保真度和性能提升到新的高度。幫助您在渲染技術時代構建優化的、無錯誤的應用程序,最新版本的 NVIDIA Nsight Graphics 引入光線追蹤開發的新功能,包括利用 AI 加速的工具。 查看 NVIDIA Nsight Graphics 2024.1 版本視頻中的新增功能。 在 Nsight Graphics Pro 中提供,Vulkan Shader Debugger 引入了一套強大的工具,用于檢查和調試著色器。 這使您能夠實時調試長達數百或數千行的復雜著色器。它完全在 GPU 上運行,您的應用程序在您深入了解著色器代碼的同時實時執行。圖形以全速運行,直到達到指定的斷點,因此導航到調試位置時不會影響性能,并且在調試時盡可能減少開銷。 調試工作流程與傳統 IDE 類似。您可以逐步執行代碼并檢查運行中的著色器狀態和變量。
Source
]]>
9497
-
強大的著色器見解:通過 NVIDIA Nsight Graphics 使用著色器調試信息
http://www.open-lab.net/zh-cn/blog/harness-powerful-shader-insights-using-shader-debug-info-with-nvidia-nsight-graphics/
Thu, 14 Mar 2024 07:19:35 +0000
http://www.open-lab.net/zh-cn/blog/?p=9413
Continued]]>
隨著光線追蹤成為現代游戲引擎中的主要渲染技術,單個 GPU RayGen 著色器現在可以執行幀的大部分光線模擬。為了管理這種復雜程度,有必要在 HLSL 或 GLSL 源代碼級別觀察著色器性能的分解。因此,著色器分析器現在是優化光線追蹤的必備工具。 在本文中,我將向您展示如何使用 NVIDIA Nsight Graphics 的 GPU Trace Profiler 來分析低級別的著色器性能,以及如何啟用 DirectX 編譯器 (DXC) 的調試信息選項 。在整個博文中,我將使用以下縮寫: Path Tracing SDK 示例使用嵌入式著色器調試信息編譯所有著色器 () 作為 DXC 命令行選項,CMake 文件 中進行了配置。如果不需要 選項,可以從 Visual Studio 解決方案中刪除它并進行重建。 我還使用默認設置 (啟用了 Real-Time…
Source
]]>
9413
-
Direct3D 12 中的工作圖:延遲著色案例研究
http://www.open-lab.net/zh-cn/blog/work-graphs-in-direct3d-12-a-case-study-of-deferred-shading/
Mon, 11 Mar 2024 06:45:26 +0000
http://www.open-lab.net/zh-cn/blog/?p=9206
Continued]]>
在游戲應用程序性能方面,GPU 驅動的渲染能夠提升處理大型虛擬場景的可擴展性。Direct3D 12 (D3D12) 采用工作圖形(work graph)編程范式,允許 GPU 在運行時生成自己的工作。有關工作圖形的介紹,請參閱 在 Direct3D 12 中使用工作圖推進 GPU 驅動的渲染。 本文介紹了一個 Direct3D 12 工作圖形案例研究。我將介紹通過工作圖形的高效著色器代碼選擇和執行,常見延遲著色渲染算法如何從中受益。然后,我將從此案例研究中探索工作圖形的更高級主題、學習內容和建議。 相較于Direct3D 12 (D3D12) API 中的工作圖形具有在微觀級別動態選擇和啟動著色器的獨特功能。例如,考慮將屏幕劃分為小塊。對于每個小塊,必須執行某種操作,具體取決于該小塊的內容。假設每個小塊有 10 種可能性。您可以使用三種不同的方法來完成此操作:
Source
]]>
9206
-
CUDA 工具包 12.4 增強對 NVIDIA Grace Hopper 和機密計算的支持
http://www.open-lab.net/zh-cn/blog/cuda-toolkit-12-4-enhances-support-for-nvidia-grace-hopper-and-confidential-computing/
Wed, 06 Mar 2024 06:11:56 +0000
http://www.open-lab.net/zh-cn/blog/?p=9109
Continued]]>
最新版本的 CUDA 工具包,即 版本 12.4,繼續利用最新的 NVIDIA GPU 來推動加速計算性能。本文將介紹此版本中包含的新功能和增強功能: CUDA 和 CUDA 工具套件軟件為數據科學和分析、機器學習、使用大型語言模型 (LLM) 進行深度學習的所有 NVIDIA GPU 加速計算應用程序提供基礎 .CUDA 軟件堆棧和生態系統提供一個平臺,幫助開發者解決全球極為復雜的計算問題,尤其是在多 GPU 和多節點分布式架構中。 每個 CUDA 工具包版本都需要最低版本的 CUDA 驅動程序。CUDA 驅動程序具有向后兼容性,這意味著使用特定版本的 CUDA 編譯的應用程序將繼續在后續版本的驅動程序中運行。有關兼容性的更多信息,請參閱 CUDA C++最佳實踐指南。 此版本引入了一種新的內存遷移算法,適用于 NVIDIA Grace Hopper 系統。
Source
]]>
9109
-
借助基礎 HPC 軟件發揮 NVIDIA Grace 和 NVIDIA Hopper 架構的強大功能
http://www.open-lab.net/zh-cn/blog/unlock-the-power-of-nvidia-grace-and-nvidia-hopper-architectures-with-foundational-hpc-software/
Thu, 16 Nov 2023 05:26:09 +0000
http://www.open-lab.net/zh-cn/blog/?p=8309
Continued]]>
高性能計算(HPC)為模擬和建模、醫療健康、生命科學、工業和工程等領域的應用提供支持。在現代數據中心,HPC 與 AI 協同工作,以變革性的新方式利用數據。 新一代 HPC 應用程序對性能和吞吐量的需求催生了一個能夠處理多種工作負載并在 CPU 和 GPU 之間實現緊密協作的加速計算平臺。NVIDIA Grace CPU 和 NVIDIA Hopper GPU 構成了用于 HPC 開發的行業領先硬件生態系統。 NVIDIA 提供了一系列工具、庫和編譯器,幫助開發者充分利用 NVIDIA Grace 和 NVIDIA Grace Hopper 架構的潛力。這些資源支持創新,并助力應用程序最大化地利用加速計算的優勢。此基礎軟件堆棧不僅提供了 GPU 加速的方法,還包括在基于 NVIDIA Grace 的系統上移植和優化應用程序的策略。
Source
]]>
8309
-
CUDA 工具包 12.3 為加速計算提供新功能
http://www.open-lab.net/zh-cn/blog/cuda-toolkit-12-3-delivers-new-features-for-accelerated-computing-2/
Wed, 01 Nov 2023 05:52:10 +0000
http://www.open-lab.net/zh-cn/blog/?p=8174
Continued]]>
NVIDIA DLSS 技術的最新版本使用最新的 NVIDIA GPU,通過 CUDA 工具包 繼續推動加速計算性能的發展。此版本的新功能,版本 12.3 包括: CUDA 和 CUDA 工具包繼續為數據科學、機器學習和深度學習、使用 LLM 進行訓練和推理、圖形和仿真以及科學計算等領域的所有加速計算應用提供基礎。CUDA 對于幫助解決世界上最復雜的計算問題至關重要。 最新版本的 NVIDIA Nsight 開發者工具 已包含在 CUDA 工具包中,可幫助您在 GPU 上優化和調試 CUDA 應用程序,適用于NVIDIA Grace Hopper 平臺。 Nsight 計算 為 CUDA 內核提供詳細的分析和分析,版本 2023.3 隨 CUDA 工具包 12.3 首次亮相。此版本包含可提高性能以及數據收集和分析能力的功能。
Source
]]>
8174
-
NVIDIA 推出 CUDA Toolkit 12.3 版本,發布用于加速計算的一系列新功能!
http://www.open-lab.net/zh-cn/blog/cuda-toolkit-12-3-delivers-new-features-for-accelerated-computing/
Mon, 23 Oct 2023 06:10:56 +0000
http://www.open-lab.net/zh-cn/blog/?p=8054
Continued]]>
NVIDIA推出最新版本的 CUDA Toolkit, 使用最新的 NVIDIA GPU 持續推動加速計算性能的發展。CUDA Toolkit 12.3 版的新功能包括: CUDA 和 CUDA Toolkit繼續為多個領域內的加速計算應用提供支持,這些領域包括:數據科學、機器學習和深度學習、用于訓練和推理的大語言模型的生成式AI、圖形和模擬、科學計算等。CUDA 為解決世界上最復雜的計算問題提供強大的技術支持。 NVIDIA Nsight 開發者工具 CUDA Toolkit 12.3包含最新版本的 NVIDIA Nsight 開發者工具,可幫助您在 NVIDIA Grace Hopper 平臺上優化和調試CUDA 應用程序。 Nsight Compute Nsight Compute 為 CUDA 內核提供了詳細的評測和分析,2023.3…
Source
]]>
8054
-
高級 API 性能:調試
http://www.open-lab.net/zh-cn/blog/advanced-api-performance-debugging/
Fri, 13 Oct 2023 06:19:04 +0000
http://www.open-lab.net/zh-cn/blog/?p=8018
Continued]]>
NVIDIA 提供了大量的圖形調試工具,包括 NVIDIA Nsight System 用于 CPU 調試,Nsight Graphics 用于 GPU 調試。而 Nsight Aftermath 則可用于分析崩潰轉儲文件。 感謝 Patrick Neill、Jeffrey Kiel、Justin Kim、Andrew Allan 和 Louis Bavoil 在本文中的幫助。 …
Source
]]>
8018
-
新視頻系列: CUDA 開發者工具教程
http://www.open-lab.net/zh-cn/blog/new-video-series-cuda-developer-tools-tutorials/
Mon, 25 Sep 2023 05:25:59 +0000
http://www.open-lab.net/zh-cn/blog/?p=7918
Continued]]>
GPU 加速 實現了比以往任何時候都更快、更智能的應用程序。 CUDA Toolkit 是在 NVIDIA GPU 上實現加速的關鍵。然而,調試、分析和優化 CUDA 可能是一個挑戰,尤其是當您無法檢查硬件級別的吞吐量和性能時。為了幫助您駕馭 CUDA 加速,NVIDIA 提供了 Nsight 開發者工具。 CUDA 開發者工具 是一個新的教程視頻系列,旨在幫助您開始使用 CUDA 開發工具。通過這些視頻,您可以提升自己的技能,將我們的示例應用到您自己的開發環境,并隨時了解最新的特性和功能。這些視頻將引導您了解如何分析性能報告,提供調試技巧和竅門,并向您展示優化 CUDA 代碼的最佳方法。 現在觀看本系列的前三個教程。 CUDA 開發者工具 | NVIDIA Nsight 工具生態系統 向您介紹 NVIDIA 提供的工具套件。了解如何使用每一個工具,
Source
]]>
7918
-
新視頻教程:分析和調試 NVIDIA CUDA 應用程序
http://www.open-lab.net/zh-cn/blog/new-video-tutuorial-profiling-and-debugging-nvidia-cuda-applications/
Wed, 30 Aug 2023 04:46:25 +0000
http://www.open-lab.net/zh-cn/blog/?p=7700
Continued]]>
NVIDIA CUDA 教程視頻系列第 5 集已經發布。 NVIDIA 計算開發工具產品經理 Jackson Marusarz 介紹了一套工具,可幫助您構建、調試和優化 CUDA 應用程序,使開發變得簡單高效。 這包括: IDE 和調試器:與流行的 IDE 集成,如 NVIDIA Nsight Visual Studio Edition,NVIDIA Nsight Visual Studio Code Edition 和 NVIDIA Nsight Eclipse,都可以簡化 CUDA 應用程序的代碼開發和調試。這些工具將熟悉的基于 CPU 的編程工作流用于 GPU 開發,提供智能感知和代碼完成等功能。 全系統見解: NVIDIA Nsight Systems 提供系統范圍的性能見解、CPU 進程、GPU 流和資源瓶頸的可視化。它還跟蹤 API 和庫,
Source
]]>
7700
-
NVIDIA Nsight Aftermath 加速 GPU 崩潰調試
http://www.open-lab.net/zh-cn/blog/speed-up-gpu-crash-debugging-with-nvidia-nsight-aftermath/
Wed, 09 Aug 2023 04:38:50 +0000
http://www.open-lab.net/zh-cn/blog/?p=7536
Continued]]>
NVIDIA Nsight 開發者工具 提供對 NVIDIA GPU 和圖形 API 的全面訪問,用于性能分析、優化和調試活動。當使用光線跟蹤或路徑跟蹤等高級渲染技術時,Nsight 工具是您創造流暢體驗的伙伴。 在 SIGGRAPH 2023 上,NVIDIA 舉辦了一個實驗室,探索如何使用 NVIDIA Nsight Tools 來調試和分析光線追蹤應用程序。新版本的 NVIDIA Nsight Aftermath SDK,NVIDIA Nsight Graphics 和 NVIDIA Nsight Systems 也已提供。有關 Nsight Tools 在 SIGGRAPH 上發布的更多信息,請查看 NVIDIA Graphics Tools 的最新視頻。 這篇文章探討了 Nsight Aftermath SDK 2023 .
Source
]]>
7536
人人超碰97caoporen国产