• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    數據科學

    適用于 RHEL9 的 NVIDIA 開放 GPU 數據中心驅動,由 Red Hat 簽署

    NVIDIA 和 Red Hat 合作,對 2020 年推出的預編譯 NVIDIA Driver 進行持續改進。上個月,NVIDIA 宣布 ,開放的 GPU 驅動模組將成為啟用 NVIDIA 圖形硬件的默認推薦方式。

    今天,NVIDIA 宣布 Red Hat 正在編譯并簽署 NVIDIA 開放 GPU 內核模塊 ,以進一步簡化 Red Hat Enterprise Linux 9 操作系統的使用,并為在數據中心使用 NVIDIA 硬件支持 機密計算 提供前進方向。

    現在無需任何額外的密鑰注冊配置即可安裝和使用經過簽名的開放 GPU 驅動。與當前的舊版預編譯軟件包一樣,在驅動更新時僅支持最新的 RHEL 9 內核。

    從 RHEL 9.5 開始,NVIDIA 現在提供技術預覽庫,可在 2025 年 4 月 30 日之前試用。此庫允許使用 模塊化流使 用開放式 GPU 驅動程序和舊版驅動程序(附帶說明)。

    技術預覽結束后,已簽名的內核模塊將在 NVIDIA Compute 軟件包存儲庫中與 CUDA 平臺的其他部分一起提供:CUDA-X 加速庫、CUDA 優化的應用和框架。

    有關 模塊化流及其如何與預編譯圖形驅動程序配合使用的更多信息 ,請參閱 Streamlining NVIDIA Driver Deployment on RHEL 8 with Modularity Streams

    激活技術預覽?

    要使用經過簽名的 NVIDIA 開源 GPU 驅動模塊,請確保已啟用 Red Hat 資源庫,包括 RHEL9 AppStream、RHEL9 BaseOS 和 RHEL9 CRB:

    $ subscription-manager repos --enable=rhel-9-for-x86_64-appstream-rpms
    $ subscription-manager repos --enable=rhel-9-for-x86_64-baseos-rpms
    $ subscription-manager repos --enable=codeready-builder-for-rhel-9-x86_64-rpms

    添加 CUDA 網絡存儲庫:

    $ sudo dnf config-manager --add-repo=https://developer.download.nvidia.com/compute/cuda/preview/repos/rhel9/x86_64/

    激活技術預覽庫后,請查看支持的模塊化流:

    $ dnf module list nvidia-driver
    The screenshot shows the shell prompt executing the sudo dnf module list nvidia-driver command and which driver releases are supported.
    圖 1、已安裝的 NVIDIA 模塊化流的技術預覽工具中的輸出列表示例

    技術預覽提供了以下新的模塊化流:

    • latest-open-gpu
    • <driver_version>-open-gpu

    安裝最新的流,選擇使用經過簽名的預編譯軟件包:

    $ sudo dnf module install nvidia-driver:latest-open-gpu

    重啟并盡情享受吧!

    A screenshot shows the shell prompt and execution of the nvidia-smi command, which displays the CUDA driver version and system parameters within the Modularity streams.
    圖 2、顯示 正在運行的 NVIDIA CUDA 驅動程序版本和系統參數的 nvidia-smi 命令輸出示例

    技術預覽庫的重要注意事項

    舊版預編譯驅動也列在模塊化流中:

    • nvidia-driver:latest
    • nvidia-driver:latest-<major_version>
    • nvidia-driver:<major_version>

    這些驅動已由 NVIDIA 簽名,需要簽名密鑰注冊。它們可以正常安裝,沒有任何警告,但在重啟后,NVIDIA 圖形驅動程序將不可用:

    $ nvidia-smi
    NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

    經過進一步檢查,問題變得明顯:

    # insmod /usr/lib/modules/5.14.0-503.16.1.el9_4.x86_64/extra/drivers/video/nvidia/nvidia.ko
     
    insmod: ERROR: could not insert module /usr/lib/modules/5.14.0-503.16.1.el9_4.x86_64/extra/drivers/video/nvidia/nvidia.ko: Key was rejected by service

    發生這種情況的原因是默認情況下啟用了 secure boot:

    $ sudo mokutil --sb-state
    SecureBoot enabled

    本模塊由 NVIDIA 使用不在信任鏈中的密鑰進行簽名:

    $ modinfo /usr/lib/modules/5.14.0-503.16.1.el9_4.x86_64/extra/drivers/video/nvidia/nvidia.ko | grep signer
    signer: NVIDIA

    有關使用 mokutil 注冊 NVIDIA 簽名密鑰的更多信息,請參閱 GitHub 上的 UEFI Secure Boot。

    安裝?

    在已啟用安全啟動的主機上安裝技術預覽庫:

    $ sudo dnf config-manager --add-repo=https://developer.download.nvidia.com/compute/cuda/preview/repos/rhel9/x86_64/
    $ sudo dnf module install nvidia-driver:latest-open-gpu
    $ sudo reboot

    如果您發現任何打包問題,請向 github.com/NVIDIA/yum-packaging-precompiled-kmod/issues 報告這些問題。

    此庫的有效期至 2025 年 3 月 31 日。

    總結?

    現在,借助 NVIDIA 和 Red Hat 的簽名軟件包,在 RHEL 9 上使用 NVIDIA 進行安全啟動會更好。您可以期待此領域的更多開發。

    您可在 /NVIDIA/open-gpu-kernel-modules GitHub 倉庫中獲取驅動源代碼。

    GitHub 上提供了打包模板和說明,以便您為自定義內核和衍生 Linux 發行版維護自己的預編譯內核模塊包:

    如要提供反饋,請 發送評論 報告驅動錯誤 。如果您還不是會員,請 加入 NVIDIA Developer Program

    ?

    0

    標簽

    人人超碰97caoporen国产