Zachary Bourque – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Fri, 14 Feb 2025 04:54:53 +0000 zh-CN hourly 1 196178272 CUDA 運行時中的動態加載機制 http://www.open-lab.net/zh-cn/blog/dynamic-loading-in-the-cuda-runtime/ Fri, 31 Jan 2025 04:52:19 +0000 http://www.open-lab.net/zh-cn/blog/?p=12889 Continued]]> 過去,我們使用 等離線工具將 GPU 設備代碼與應用程序一起編譯。在這種情況下,GPU 設備代碼在 CUDA 運行時內部進行管理。然后,您可以使用 啟動內核,并且 CUDA 運行時可確保啟動所調用的內核。 但是,在某些情況下,需要動態編譯和加載 GPU 設備代碼。本文介紹了使用 CUDA 運行時實現此目標的方法,同時還展示了在 CUDA 驅動程序和 CUDA 運行時核句柄之間實現互操作性的方法。 在 CUDA 12.0 中,NVIDIA 通過 CUDA 驅動引入了 APIs。這些 APIs 使您能夠以與上下文無關的方式動態選擇和加載 GPU 設備代碼。有關更多信息,請參閱 CUDA Context-Independent Module Loading 。 現在,我們將此功能擴展為通過 CUDA 運行時加載動態 GPU 設備代碼,

Source

]]>
12889
NVIDIA CUDA 工具包符號服務器 http://www.open-lab.net/zh-cn/blog/cuda-toolkit-symbol-server/ Thu, 07 Sep 2023 06:11:55 +0000 http://www.open-lab.net/zh-cn/blog/?p=7846 Continued]]> NVIDIA 已經提供了 Windows 系統的 GPU 驅動程序二進制符號服務器。現在,NVIDIA 也開始提供 Linux 系統的 CUDA Toolkit 符號。 NVIDIA 正在為 Linux 引入 CUDA Toolkit 符號,以增強應用程序開發功能。在應用程序開發過程中,您現在可以下載正在應用程序中調試或分析的 NVIDIA 庫的模糊符號。這是 CUDA 驅動程序的初始裝運(lib CUDA .so)和 CUDA 運行時(libcudart.so),將添加更多庫。 例如,當問題似乎與 CUDA neneneba API 有關時,可能并不總是能夠向 NVIDIA 提供具有所有庫加載信息的再現示例、核心轉儲或未同步堆棧跟蹤。提供符號化的調用堆棧可以幫助加快調試過程。 我們只是托管符號文件,所以調試數據不會被分發。符號文件包含模糊的符號名稱。

Source

]]>
7846
人人超碰97caoporen国产