新一代 NVIDIA 圖形硬件已經面世。由 NVIDIA Blackwell 提供支持的 GeForce RTX 50 系列 GPU 可提供突破性的全新 RTX 功能,例如支持多幀生成的 DLSS 4,以及支持 RTX Mega Geometry 和 RTX Neural Shaders 的 NVIDIA RTX Kit 。NVIDIA RTX Blackwell 架構采用第五代 Tensor Cores 來驅動 AI 工作負載和第四代 RT Cores,三角形交叉速率是上一代的兩倍。它配備超快的 GDDR7 內存,可大幅提升總內存帶寬。
NVIDIA Nsight 開發者工具 支持圖形開發者使用 GeForce RTX 50 系列 GPUs 打造更加逼真的世界和仿真。
在 NVIDIA Nsight Graphics 中設計和優化光線追蹤應用
NVIDIA Nsight Graphics 是一款用于設計、調試和優化游戲和其他圖形應用的獨立工具。在版本 2025.1 中,所有開發工作流現均可在 Blackwell GPUs 上使用:Frame Debugging、Ray Tracing Inspector、GPU Trace、Real Time Shader Profiler 和 Vulkan Shader Debugging。
對于從事優化工作的開發者而言, NVIDIA Blackwell 架構 的一項主要功能是顯著提高了性能計數器觀察功能,支持的計數器數量約為 NVIDIA Ada Lovelace 架構 的 8 倍。硬件性能計數器和管理軟件堆棧—NVIDIA Nsight Perf SDK 庫—構成了 Nsight Graphics GPU Trace 等性能分析工具的基礎。
Blackwell 架構中的擴展計數器在流多處理器 (SM) 利用率和效率、線程束和資源占用率、緩存帶寬、命中率等方面帶來了革命性的新細節水平。GPU Trace 可在時間軸上、改進的表格和工具提示中顯示這些計數器。由于能夠同時收集更多計數器,因此您不必選擇配置或重新運行應用程序。您只需一次運行即可收到所有內容。
NVIDIA Nsight Systems 中的系統級性能調優
NVIDIA Nsight Systems 自上而下地捕獲圖形應用程序的性能以及 CPU 和 GPU 的資源利用率。這樣可以識別性能限制器,并將其與其他硬件事件關聯,從而為調優活動提供指導。用例包括確定運行時中受 CPU 限制的部分與受 GPU 限制的部分、卡頓分析、圖形 API 資源跟蹤等。Nsight Systems 2025.1 增加了記錄 Blackwell GPU 指標的功能。
使用 NVIDIA Nsight Aftermath SDK 診斷崩潰
NVIDIA Nsight Aftermath SDK 集成到 D3D12 和 Vulkan 應用中,可在發生異常或 TDR 時生成 GPU 崩潰報告,幫助開發者追蹤和調試已部署應用中難以重現的錯誤。版本 2025.1 增加了在 Blackwell GPU 上生成崩潰報告的支持。應用應更新到最新的 SDK,以確保跨所有架構提供持續支持。
借助 NVIDIA Nsight Perf SDK 實現實時 HUD
NVIDIA Nsight Perf SDK empowers 您可以將 GPU 性能測量、可視化和報告生成功能直接引入自己的應用。它包含內置的 HUD 渲染器,可輕松實現實時的高級性能分診。Nsight Perf SDK 還管理硬件性能計數器的基礎,所有 Nsight 工具都是在此基礎上構建的。版本 2025.1 全面支持 Blackwell 架構現已提供的單遍指標擴展功能集。
開始使用 Nsight Developer Tools
借助 Nsight Developer Tools 開發者工具,創造新世界并探索 AI 增強型神經渲染技術的強大功能。支持 NVIDIA RTX Blackwell 架構的全套工具現已推出。首先,下載最新版本:
- NVIDIA Nsight Graphics 2025.1
- NVIDIA Nsight Aftermath SDK 2025.1
- NVIDIA Nsight Systems 2025.1.1
- NVIDIA Nsight Perf SDK 2025.1
詳細了解 Nsight Developer Tools ,并探索 Nsight Tools 的 教程 。 在 Nsight Developer Forums 上提出問題、提供反饋并與開發者社區互動。