Oleg Kuznetsov – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 23 Nov 2023 04:48:06 +0000 zh-CN hourly 1 196178272 高級 API 性能:內部函數 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-intrinsics/ Tue, 21 Nov 2023 04:45:46 +0000 http://www.open-lab.net/zh-cn/blog/?p=8292 Continued]]> Intrinsics 可被視為特定硬件指令的更高級別的抽象。它們提供對低級操作或特定于硬件的功能的直接訪問,從而提高性能。這樣,就可以在線程束中的線程間執行操作,也稱為線程束中的線程波前. 以下代碼示例是 SM6 的示例: …

Source

]]>
8292
高級 API 性能:同步 http://www.open-lab.net/zh-cn/blog/advanced-api-performance-synchronization/ Mon, 31 Jul 2023 03:01:07 +0000 http://www.open-lab.net/zh-cn/blog/?p=7493 Continued]]> 圖形編程中的同步是指協調和控制并發操作,以確保渲染任務的正確和可預測執行。 CPU 和 GPU 之間的不正確同步可能導致性能下降、比賽條件和視覺偽影。 …

Source

]]>
7493
人人超碰97caoporen国产