Oleg Kuznetsov – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 23 Nov 2023 04:48:06 +0000
zh-CN
hourly
1
196178272 -
高級 API 性能:內部函數
http://www.open-lab.net/zh-cn/blog/advanced-api-performance-intrinsics/
Tue, 21 Nov 2023 04:45:46 +0000
http://www.open-lab.net/zh-cn/blog/?p=8292
Continued]]>
Intrinsics 可被視為特定硬件指令的更高級別的抽象。它們提供對低級操作或特定于硬件的功能的直接訪問,從而提高性能。這樣,就可以在線程束中的線程間執行操作,也稱為線程束中的線程波前. 以下代碼示例是 SM6 的示例: …
Source
]]>
8292
-
高級 API 性能:同步
http://www.open-lab.net/zh-cn/blog/advanced-api-performance-synchronization/
Mon, 31 Jul 2023 03:01:07 +0000
http://www.open-lab.net/zh-cn/blog/?p=7493
Continued]]>
圖形編程中的同步是指協調和控制并發操作,以確保渲染任務的正確和可預測執行。 CPU 和 GPU 之間的不正確同步可能導致性能下降、比賽條件和視覺偽影。 …
Source
]]>
7493
人人超碰97caoporen国产