Dynamic Parallelism – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Tue, 26 Oct 2021 07:06:03 +0000
zh-CN
hourly
1
196178272 -
高級 API 性能:異步復制
http://www.open-lab.net/zh-cn/blog/advanced-api-performance-async-copy/
Fri, 22 Oct 2021 07:05:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2030
Continued]]>
這篇文章介紹了 NVIDIA GPU 上異步復制的最佳實踐。要在應用程序中獲得高且一致的幀速率,請參閱所有高級 API 性能提示. 異步復制在完全獨立的硬件上運行,但您必須將其調度到單獨的隊列中。您可以考慮將異步副本轉換為異步計算作為性能策略。 NVIDIA 有專用的異步復制引擎。按性能改進的降序使用以下策略: 部分并行性要求開發人員創建和管理一個單獨的拷貝隊列,這需要隔離和可能的調度復雜性。在這種情況下,將同步副本轉換為異步計算比異步副本更值得。但是,任何不能轉換為異步計算的工作也不能轉換為異步副本,反之亦然。 感謝帕特里克·尼爾、艾倫·沃爾夫和邁克·墨菲的幫助 p 建議和審查本職位。 …
Source
]]>
2030
人人超碰97caoporen国产