運行時編譯 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Fri, 14 Feb 2025 04:54:53 +0000
zh-CN
hourly
1
196178272 -
適用于 RHEL9 的 NVIDIA 開放 GPU 數據中心驅動,由 Red Hat 簽署
http://www.open-lab.net/zh-cn/blog/nvidia-open-gpu-datacenter-drivers-for-rhel9-signed-by-red-hat/
Mon, 10 Feb 2025 04:07:54 +0000
http://www.open-lab.net/zh-cn/blog/?p=12853
Continued]]>
NVIDIA 和 Red Hat 合作,對 2020 年推出的預編譯 NVIDIA Driver 進行持續改進。上個月,NVIDIA 宣布 ,開放的 GPU 驅動模組將成為啟用 NVIDIA 圖形硬件的默認推薦方式。 今天,NVIDIA 宣布 Red Hat 正在編譯并簽署 NVIDIA 開放 GPU 內核模塊 ,以進一步簡化 Red Hat Enterprise Linux 9 操作系統的使用,并為在數據中心使用 NVIDIA 硬件支持 機密計算 提供前進方向。 現在無需任何額外的密鑰注冊配置即可安裝和使用經過簽名的開放 GPU 驅動。與當前的舊版預編譯軟件包一樣,在驅動更新時僅支持最新的 RHEL 9 內核。 從 RHEL 9.5 開始,NVIDIA 現在提供技術預覽庫,可在 2025 年 4 月 30 日之前試用。此庫允許使用 模塊化流使 用開放式 GPU…
Source
]]>
12853
-
CUDA 運行時中的動態加載機制
http://www.open-lab.net/zh-cn/blog/dynamic-loading-in-the-cuda-runtime/
Fri, 31 Jan 2025 04:52:19 +0000
http://www.open-lab.net/zh-cn/blog/?p=12889
Continued]]>
過去,我們使用 等離線工具將 GPU 設備代碼與應用程序一起編譯。在這種情況下,GPU 設備代碼在 CUDA 運行時內部進行管理。然后,您可以使用 啟動內核,并且 CUDA 運行時可確保啟動所調用的內核。 但是,在某些情況下,需要動態編譯和加載 GPU 設備代碼。本文介紹了使用 CUDA 運行時實現此目標的方法,同時還展示了在 CUDA 驅動程序和 CUDA 運行時核句柄之間實現互操作性的方法。 在 CUDA 12.0 中,NVIDIA 通過 CUDA 驅動引入了 APIs。這些 APIs 使您能夠以與上下文無關的方式動態選擇和加載 GPU 設備代碼。有關更多信息,請參閱 CUDA Context-Independent Module Loading 。 現在,我們將此功能擴展為通過 CUDA 運行時加載動態 GPU 設備代碼,
Source
]]>
12889
-
借助 NVIDIA cuPyNumeric,將 NumPy 無縫擴展從筆記本電腦到超級計算機
http://www.open-lab.net/zh-cn/blog/effortlessly-scale-numpy-from-laptops-to-supercomputers-with-nvidia-cupynumeric/
Mon, 18 Nov 2024 06:51:35 +0000
http://www.open-lab.net/zh-cn/blog/?p=12023
Continued]]>
Python 是數據科學、機器學習和數值計算領域最常用的編程語言。它在科學家和研究人員中日益受歡迎。在 Python 生態系統中, NumPy 是執行基于數組的數值計算的基礎 Python 庫。 NumPy 的標準實現可在單個 CPU 核心上運行,只有一些操作可以跨核心并行執行。這種單線程、僅使用 CPU 的執行方式限制了可處理的數據規模,也限制了執行計算的速度。 雖然可以使用 GPU 加速的 NumPy 實現,但跨多個 GPU 或節點擴展基于 NumPy 的代碼通常需要大量的代碼修改,包括手動數據分區和同步以及用于分布式執行的數據移動。這種代碼更改可能十分復雜且耗時,以確保功能正確且性能出色。 此外,在分布式編程方面缺乏專業知識的領域科學家通常會與計算機科學專家合作或咨詢,以完成更改,這進一步減緩了實驗和驗證研究的過程。 為解決這一生產力問題,
Source
]]>
12023
-
使用 NVIDIA CUDA Toolkit 12.4 編譯器創建運行時 Fatbin
http://www.open-lab.net/zh-cn/blog/runtime-fatbin-creation-using-the-nvidia-cuda-toolkit-12-4-compiler/
Tue, 18 Jun 2024 08:20:13 +0000
http://www.open-lab.net/zh-cn/blog/?p=10451
Continued]]>
CUDA Toolkit 12.4 引入了一個新的 nvFatbin 庫,用于在運行時創建 fatbins。fatbins,也稱為 NVIDIA 設備代碼fat 二進制文件sm_61和。 到目前為止,要生成 fatbin,必須依賴命令行工具,這不適合動態代碼生成。這使得動態生成 fatbins 變得困難,因為您需要將生成的代碼放入一個文件中,然后使用或類似命令調用,并處理輸出,這顯著增加了動態生成 fatbins 的難度,并導致多次嘗試通過各種容器模仿 fatbins。 CUDA Toolkit 12.4 引入了 nvFatbin,這是一個新的庫,能夠通過編程創建 fatbin,從而大大簡化了這項任務,不再需要寫入文件、調用、解析命令行輸出和從目錄中獲取輸出文件。 使用 nvFatbin 庫類似于任何其他熟悉的庫,如NVRTC、
Source
]]>
10451
-
CUDA 工具包 12.3 為加速計算提供新功能
http://www.open-lab.net/zh-cn/blog/cuda-toolkit-12-3-delivers-new-features-for-accelerated-computing-2/
Wed, 01 Nov 2023 05:52:10 +0000
http://www.open-lab.net/zh-cn/blog/?p=8174
Continued]]>
NVIDIA DLSS 技術的最新版本使用最新的 NVIDIA GPU,通過 CUDA 工具包 繼續推動加速計算性能的發展。此版本的新功能,版本 12.3 包括: CUDA 和 CUDA 工具包繼續為數據科學、機器學習和深度學習、使用 LLM 進行訓練和推理、圖形和仿真以及科學計算等領域的所有加速計算應用提供基礎。CUDA 對于幫助解決世界上最復雜的計算問題至關重要。 最新版本的 NVIDIA Nsight 開發者工具 已包含在 CUDA 工具包中,可幫助您在 GPU 上優化和調試 CUDA 應用程序,適用于NVIDIA Grace Hopper 平臺。 Nsight 計算 為 CUDA 內核提供詳細的分析和分析,版本 2023.3 隨 CUDA 工具包 12.3 首次亮相。此版本包含可提高性能以及數據收集和分析能力的功能。
Source
]]>
8174
-
NVIDIA 推出 CUDA Toolkit 12.3 版本,發布用于加速計算的一系列新功能!
http://www.open-lab.net/zh-cn/blog/cuda-toolkit-12-3-delivers-new-features-for-accelerated-computing/
Mon, 23 Oct 2023 06:10:56 +0000
http://www.open-lab.net/zh-cn/blog/?p=8054
Continued]]>
NVIDIA推出最新版本的 CUDA Toolkit, 使用最新的 NVIDIA GPU 持續推動加速計算性能的發展。CUDA Toolkit 12.3 版的新功能包括: CUDA 和 CUDA Toolkit繼續為多個領域內的加速計算應用提供支持,這些領域包括:數據科學、機器學習和深度學習、用于訓練和推理的大語言模型的生成式AI、圖形和模擬、科學計算等。CUDA 為解決世界上最復雜的計算問題提供強大的技術支持。 NVIDIA Nsight 開發者工具 CUDA Toolkit 12.3包含最新版本的 NVIDIA Nsight 開發者工具,可幫助您在 NVIDIA Grace Hopper 平臺上優化和調試CUDA 應用程序。 Nsight Compute Nsight Compute 為 CUDA 內核提供了詳細的評測和分析,2023.3…
Source
]]>
8054
人人超碰97caoporen国产