Steven Gurfinkel – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 04 Jul 2024 05:06:45 +0000
zh-CN
hourly
1
196178272 -
使用 CRIU 實現 CUDA 應用程序檢查點
http://www.open-lab.net/zh-cn/blog/checkpointing-cuda-applications-with-criu/
Tue, 02 Jul 2024 05:00:48 +0000
http://www.open-lab.net/zh-cn/blog/?p=10535
Continued]]>
CUDA 的檢查點和恢復功能通過名為 cuda-checkpoint 的命令行實用程序公開,該實用程序可用于在正在運行的 Linux 進程中以透明方式檢查點和恢復 CUDA 狀態,同時也可以與開源檢查點實用程序 CRIU(用戶空間中的檢查點/恢復)相結合,以完全檢查點 CUDA 應用程序。 透明的每進程檢查點在虛擬機檢查點和應用程序驅動檢查點之間提供了一個中間地帶。每進程檢查點可與容器結合使用,檢查復雜應用程序的狀態,從而促進諸如以下用例。 CRIU(用戶空間中的檢查點/恢復)是適用于 Linux 的開源檢查點實用程序,在 NVIDIA 外部進行維護,可以檢查點和恢復進程樹。 CRIU 通過一個名為并通過檢查點和恢復與進程關聯的每個內核模式資源來運行。這些資源包括: 由于這些資源的行為由 Linux 指定,并且獨立于底層硬件,
Source
]]>
10535
人人超碰97caoporen国产