渲染/光線跟蹤 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 19 Oct 2023 06:26:25 +0000 zh-CN hourly 1 196178272 高級 API 性能:調試 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-debugging/ Fri, 13 Oct 2023 06:19:04 +0000 http://www.open-lab.net/zh-cn/blog/?p=8018 Continued]]> NVIDIA 提供了大量的圖形調試工具,包括 NVIDIA Nsight System 用于 CPU 調試,Nsight Graphics 用于 GPU 調試。而 Nsight Aftermath 則可用于分析崩潰轉儲文件。 感謝 Patrick Neill、Jeffrey Kiel、Justin Kim、Andrew Allan 和 Louis Bavoil 在本文中的幫助。 …

Source

]]>
8018
DirectX 光線跟蹤中自相交偽影的求解 http://www.open-lab.net/zh-cn/blog/solving-self-intersection-artifacts-in-directx-raytracing/ Thu, 31 Aug 2023 05:33:02 +0000 http://www.open-lab.net/zh-cn/blog/?p=7781 Continued]]> 光線和路徑跟蹤算法通過從攝影機或光源開始并將光線與場景幾何體相交來構建光路。當對象被擊中時,會在這些曲面上生成新的二次光線以繼續路徑。 理論上,這些二次光線不會再次與同一三角形相交,因為相交算法排除了距離為零的相交。然而,在實踐中,實際實現中使用的有限浮點精度往往會導致假陽性結果,稱為自交叉(圖 2)。這會產生偽影,例如陰影痤瘡,其中三角形有時會不正確地陰影自己(圖 1)。 通過使用同一基元的標識符顯式地將其從交集中排除,可以避免自交集。在 DirectX 光線跟蹤(DXR)中,這種自相交檢查將在任何命中著色器中實現。然而,強制任何命中 所有三角形命中的調用都會帶來顯著的性能損失。此外,該方法不處理針對相鄰(近)共面三角形的誤報。 解決該問題的最廣泛的方案是使用各種啟發式方法來沿著光線方向或法線偏移光線。然而,這些方法不足以處理各種常見的制作內容,

Source

]]>
7781
使用下一代 NVIDIA DLSS 生成突破性的光線追蹤圖像 http://www.open-lab.net/zh-cn/blog/generate-groundbreaking-ray-traced-images-with-next-generation-nvidia-dlss/ Fri, 25 Aug 2023 05:44:26 +0000 http://www.open-lab.net/zh-cn/blog/?p=7718 Continued]]> 自 2018 年以來,NVIDIA DLSS 利用人工智能使游戲玩家和創作者能夠提高性能和質量。隨著時間的推移,這種解決方案已經發展到包括超分辨率和幀生成方面的突破性進展。 現在,人工智能神經渲染技術邁出了下一步,推出了 DLSS 3.5。此更新包括一個名為“光線重建”的重要新功能。 射線重建是一種新的神經網絡,適用于所有 GeForce RTX GPU,這進一步提高了射線追蹤圖像的圖像質量。DLSS 3.5 的數據訓練量是 DLSS 3 的 5 倍,它用 NVIDIA 超級計算機訓練的 AI 網絡取代了手動調諧的去噪器,該網絡能在采樣光線之間生成更高質量的像素。 《賽博朋克 2077》,《賽博朋克 2077:自由幻影》,艾倫·威克 2和帶有 RTX 的門戶,都將在今年秋天推出,將包括 Ray Reconstruction。 DLSS 3.5…

Source

]]>
7718
NVIDIA Nsight Aftermath 加速 GPU 崩潰調試 http://www.open-lab.net/zh-cn/blog/speed-up-gpu-crash-debugging-with-nvidia-nsight-aftermath/ Wed, 09 Aug 2023 04:38:50 +0000 http://www.open-lab.net/zh-cn/blog/?p=7536 Continued]]> NVIDIA Nsight 開發者工具 提供對 NVIDIA GPU 和圖形 API 的全面訪問,用于性能分析、優化和調試活動。當使用光線跟蹤或路徑跟蹤等高級渲染技術時,Nsight 工具是您創造流暢體驗的伙伴。 在 SIGGRAPH 2023 上,NVIDIA 舉辦了一個實驗室,探索如何使用 NVIDIA Nsight Tools 來調試和分析光線追蹤應用程序。新版本的 NVIDIA Nsight Aftermath SDK,NVIDIA Nsight Graphics 和 NVIDIA Nsight Systems 也已提供。有關 Nsight Tools 在 SIGGRAPH 上發布的更多信息,請查看 NVIDIA Graphics Tools 的最新視頻。 這篇文章探討了 Nsight Aftermath SDK 2023 .

Source

]]>
7536
由 RTX 賦能的空間框架通過 USD 實現全光線追蹤 XR 流程 http://www.open-lab.net/zh-cn/blog/rtx-powered-spatial-framework-delivers-full-ray-tracing-with-usd-for-xr-pipelines/ Tue, 08 Aug 2023 03:45:32 +0000 http://www.open-lab.net/zh-cn/blog/?p=7633 Continued]]> 開發擴展現實(XR)應用的難度極大。用戶通常會從一個模板項目入手,并按照現成的打包模板將應用部署到頭顯。這種方法給資產迭代流程帶來了嚴重的阻礙。XR體驗內的資產更新完全取決于開發者構建、打包和部署新的可執行程序的速度。 NVIDIA Omniverse中的全新空間框架通過通用場景描述(即OpenUSD)和由NVIDIA RTX驅動的光線追蹤技術幫助解決了這些難題。全球首個全光線追蹤XR體驗由此誕生,它使用戶能夠查看其場景中的每一個反射、軟陰影、豐富的光線以及幾何體的動態變化。 現在,用戶可以對包含數百萬個多邊形、物理材質和精確照明的大規模、復雜、全保真設計數據集進行全光線追蹤,來身臨其境地體驗數據集,而無需耗費額外的數據準備時間。 使用OpenUSD實現沉浸式工作流 OpenUSD可確保場景編輯不具有破壞性,從而實現不同工具和生態之間的無縫交互。

Source

]]>
7633
通過 NVIDIA OptiX 8 實現靈活且強大的光線追蹤功能 http://www.open-lab.net/zh-cn/blog/flexible-and-powerful-ray-tracing-with-optix-8/ Mon, 07 Aug 2023 03:50:05 +0000 http://www.open-lab.net/zh-cn/blog/?p=7637 Continued]]> 實現逼真的視覺效果一直是計算機圖形領域人士所追求的目標。NVIDIA OptiX 是一款強大且靈活的光線追蹤技術框架,能讓用戶充分挖掘光線追蹤的潛力。NVIDIA OptiX 是一款基于CUDA并行編程模型的GPU加速光線追蹤API,能夠提供實現光線追蹤所需的全部工具,助力在NVIDIA圖形處理器上高效地定義和執行復雜的光線追蹤算法。配合OpenGL或DirectX等圖形API,NVIDIA OptiX可幫助用戶創建渲染器,實現更快、更具成本效益的產品開發周期。 NVIDIA OptiX 廣泛應用于如產品設計、可視化等各種媒體和娛樂垂直領域。設計人員可通過它渲染出高質量的產品圖像和動畫,提升可視化設計與迭代效率。它可以準確模擬出真實的照明和材質,呈現更加逼真的最終產品。 圖 1. 人物建模圖像:在Maya和Mudbox中建模和貼圖,未使用掃描,

Source

]]>
7637
高級 API 性能:同步 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-synchronization/ Mon, 31 Jul 2023 03:01:07 +0000 http://www.open-lab.net/zh-cn/blog/?p=7493 Continued]]> 圖形編程中的同步是指協調和控制并發操作,以確保渲染任務的正確和可預測執行。 CPU 和 GPU 之間的不正確同步可能導致性能下降、比賽條件和視覺偽影。 …

Source

]]>
7493
高級 API 性能:管道狀態對象 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-pipeline-state-objects/ Tue, 18 Jul 2023 05:36:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=7431 Continued]]> 管道狀態對象( PSO )定義了在向 GPU 提交工作時硬件如何解釋和渲染輸入數據。 PSO 的正確管理對于系統資源的最佳使用和游戲的順利進行至關重要。 本文介紹了在 NVIDIA GPU 上使用管道狀態對象時的最佳實踐。要在應用程序中獲得高性能且一致的幀速率,請參考高級 API 性能技巧。 感謝 Patrick Neil 和 Dhiraj Kumar 的建議和幫助。 …

Source

]]>
7431
加速數據分析:數據可視化指南 RAPIDS http://www.open-lab.net/zh-cn/blog/accelerated-data-analytics-a-guide-to-data-visualization-with-rapids/ Tue, 11 Jul 2023 03:20:58 +0000 http://www.open-lab.net/zh-cn/blog/?p=7357 Continued]]> 本文是加速數據分析系列文章的一部分。 可視化使數據栩栩如生,通過可訪問的視覺效果揭示隱藏的模式和見解,并使您和您的組織能夠感知無形的事物,做出明智的決策,并充分利用您的數據。 特別是在處理大型數據集時,交互可能會變得非常困難,因為渲染和計算時間變得太長。切換到 RAPIDS cuDF 等庫,支持 GPU 加速,通過熟悉的類似 pandas 的 API 解鎖對數據見解的訪問。這篇文章解釋道: 雖然數據可視化是在項目結束時解釋數據見解的有效工具,但理想情況下,應在整個數據探索和豐富過程中使用它們。可視化擅長于通過發現純分析方法不容易出現的異常值、異常和模式來增強數據理解,這已經被證明,例如Anscombe’s quartet以及臭名昭著的Datasaurus Dozen。 有效的圖表應遵循數據可視化設計原則,利用先前注意力可視處理,

Source

]]>
7357
使用 SetBackgroundProcessingMode 對 DirectX 12 進行游戲內 GPU 分析 http://www.open-lab.net/zh-cn/blog/in-game-gpu-profiling-for-dx12-using-setbackgroundprocessingmode/ Mon, 10 Jul 2023 03:46:16 +0000 http://www.open-lab.net/zh-cn/blog/?p=7367 Continued]]> 如果你是 DirectX 12(DX12) 游戲開發人員,你可能已經注意到,即使應用程序端沒有任何變化,游戲 HUD 中實時顯示的 GPU 時間也可能會隨著時間的推移而變化。 GPU 時間變化的一個原因可能是 GPU Boost 動態地改變 GPU 核心時鐘頻率。即使使用 DX12 禁用了 GPU 升壓 SetStablePowerState API,GPU 游戲中測得的計時也可能在不同的跑步或每幀之間發生意外變化。需要考慮的因素包括是否進行了背景驅動程序優化,以及何時部署了優化后的著色器。 這篇文章提供了在使用 DX12 監控后臺驅動程序優化狀態的同時,在 NVIDIA GPU 上執行游戲內 GPU 評測的最佳實踐,使用 SetBackgroundProcessingMode API。 如果 DX12 驅動程序檢測到 CPU 開銷可能對 DX12…

Source

]]>
7367
現已上市: NVIDIA DLSS 3 用于虛幻引擎 5 http://www.open-lab.net/zh-cn/blog/now-available-nvidia-dlss-3-for-unreal-engine-5/ Wed, 21 Jun 2023 07:32:01 +0000 http://www.open-lab.net/zh-cn/blog/?p=7298 Continued]]> NVIDIA DLSS 3 是一種神經圖形技術,使用 AI 圖像重建和幀生成來提高性能,它是由三個核心創新組成的: 在這三項技術的支持下, DLSS 3 實現了 4 倍以上的性能提升,為下一代路徑跟蹤渲染提供了空間。 DLSS Super Resolution 自 2021 年起在虛幻引擎中提供,使其能夠輕松地將 NVIDIA AI 縮放技術集成到虛幻引擎項目中。 NVIDIA 現已發布用于虛幻引擎 5 . 2 的 DLSS 3 ,其中包括 Frame Generation 和最新的 NVIDIA Reflex 版本。有關虛幻引擎 5 . 1 及更早版本的更多信息,請參閱本文后面安裝指南中的步驟 2 。 為了盡可能簡單地將 NVIDIA 技術集成到您的項目中,DLSS 3 Unreal Engine 5.2…

Source

]]>
7298
如何成功集成 NVIDIA DLSS 3 http://www.open-lab.net/zh-cn/blog/how-to-successfully-integrate-dlss-3/ Wed, 21 Jun 2023 07:26:36 +0000 http://www.open-lab.net/zh-cn/blog/?p=7295 Continued]]> NVIDIA DLSS 幀生成是 DLSS 3 中使用 AI 創建全新幀的新性能倍增器,使實時路徑追蹤成為電子游戲圖形領域的下一個前沿。 NVIDIA 發布了 Unreal Engine 5.2 Plugin 和 Streamline 2.1 SDK 以支持開發者。 虛幻引擎開發人員現在可以開始了。通過 NVIDIA Reflex 在虛幻引擎 5 中提供的低延遲技術,他們擁有提高游戲性能的所有工具,同時為玩家提供高度響應的體驗。 如果您希望在自己的自定義引擎中進行集成, Streamline 2 . 1 可以大大簡化 DLSS 3 所需所有必要組件的手動 API 掛鉤。 Streamline 是一個開源的跨 IHV 框架,它簡化了 DLSS 3 等功能的集成。 您無需手動集成 DLSS 幀生成庫,而是確定所需插件需要哪些資源(運動向量、深度等),

Source

]]>
7295
利用合成數據聚焦遠場物體,實現基于攝像頭的 AV 感知 http://www.open-lab.net/zh-cn/blog/bringing-far-field-objects-into-focus-with-synthetic-data-for-camera-based-av-perception/ Thu, 18 May 2023 06:20:57 +0000 http://www.open-lab.net/zh-cn/blog/?p=7036 Continued]]> 檢測遠場物體,如 100 米以外的車輛,是自動駕駛系統在高速公路上安全操作的基礎 在這樣的高速環境中,每一秒都很重要。因此,如果在以 70 英里/小時的速度行駛時,自動駕駛汽車( AV )的感知范圍可以從 100 米增加到 200 米,那么車輛有更多的時間做出反應。 然而,對于通常部署在量產乘用車中的基于攝像頭的感知系統來說,擴展這一范圍尤其具有挑戰性。訓練用于遠場物體檢測的相機感知系統需要收集大量的相機數據以及地面實況( GT )標簽,例如 3D 邊界框和距離。 對于超過 200 米的物體來說,提取這些 GT 數據變得更加困難。物體離得越遠,在圖像中就越小,最終只有幾個像素寬。通常,像激光雷達這樣的傳感器與聚合和自動標記技術一起使用來提取 3D 和距離信息,但這些數據在激光雷達的工作范圍之外變得稀疏和嘈雜。

Source

]]>
7036
高級 API 性能: CPU http://www.open-lab.net/zh-cn/blog/advanced-api-performance-cpus/ Wed, 17 May 2023 04:33:41 +0000 http://www.open-lab.net/zh-cn/blog/?p=6962 Continued]]> 本文介紹了使用 NVIDIA GPU 時的 CPU 最佳實踐。要在應用程序中獲得高且一致的幀速率,請參閱高級API 性能提示。 要從 NVIDIA GPU 中獲得最佳性能,請將其與 CPU 上的高效工作委派配對。幀速率上限、卡頓和其他低于標準的應用程序性能事件通常可以追溯到 CPU 上的瓶頸。使用以下技巧來了解你應該做什么以及應該避免什么。 再多的 GPU 工作優化也無法克服 CPU 瓶頸。均勻平衡所有線程的工作,以獲得最佳效果。 向 GPU 提交一個命令列表數組( ECL )以供執行。 NVIDIA 硬件支持多個命令隊列以并行化圖形工作,使圖形計算或計算工作能夠同時執行。 創建和銷毀緩沖區、紋理和著色器是高效計算機圖形的基礎。 光線跟蹤加速結構是組織場景的幾何信息以優化光線和場景對象之間的相交測試的數據結構。

Source

]]>
6962
了解和測量 PC 延遲 http://www.open-lab.net/zh-cn/blog/understanding-and-measuring-pc-latency/ Fri, 05 May 2023 03:29:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=6924 Continued]]> 系統延遲是一個重要的游戲性能指標。在許多情況下,它對整體游戲體驗的影響比每秒幀數( FPS )更大。雖然 FPS 相對容易測量,但系統延遲傳統上很難測量 端到端( E2E )系統延遲是管道中各種延遲的總和,如圖 1 所示。為了緩解 E2E 測量困難, PC 延遲( PCL )統計數據使游戲玩家、評論家和開發人員能夠測量 PCL ,這是系統延遲的主要組成部分 外圍設備延遲+ PCL +顯示延遲可讓您全面了解 E2E 系統延遲。使用 PCL Stats ,您可以在沒有任何外部設備或干預的情況下自主測量每幀 PCL 。 要測量系統延遲管道的這一關鍵部分,請集成 PC latency Stats (通過NVIDIA Reflex SDK或虛幻引擎插件)。一旦集成, PCL 可以通過FrameView或GeForce Experience in-game overlay.

Source

]]>
6924
人人超碰97caoporen国产