• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    人工智能/深度學習

    GPU Operator 1.8 增加了對 DGX 、 HGX 和升級的支持

    最后一篇文章 ,我們研究了 MIG 運算符是如何演變的,添加了豐富的功能集來處理 GPU 發現、支持 GPU 安培體系結構的新多實例 GPU ( MIG )功能、 vGPU 以及用于 Red Hat OpenShift 的認證。

    在本文中,我們將介紹 GPU Operator release 1 . 8 中添加的新功能,進一步簡化 GPU 對各種部署場景的管理,包括:

    • 增加了對 GPU 操作員升級的支持
    • 支持 NVX 交換機系統,包括 DGX A100 和 NVIDIA HGX A100 服務器
    • 支持收集 GPU 操作員狀態指標
    • GPU 運營商和網絡運營商改進多節點培訓
    • 支持 Red Hat OpenShift 4 . 8

    NVIDIA 軟件生命周期管理

    GPU Operator 的 1 . 8 版為組織提供了更新機制,以更新其 GPU Operator 版本,而不會中斷運行 GPU Operator 的群集的工作流。 GPU Operator 的早期版本要求用戶在安裝新版本之前卸載以前的版本,這意味著在升級過程中群集中沒有可用的 GPU 。

    從 1 . 8 開始,升級版本不會中斷工作流程。該機制以滾動方式一次更新一個節點,因此其他節點可以繼續使用。只有在安裝完成且上一個節點重新聯機時,下一個節點才會更新。用戶可以確信,在更新 GPU 操作員時,他們的工作流程將得到更好的管理。

    現在支持 NVS 交換機系統

    對于 1 . 8 , GPU 操作員自動在 NVIDIA 上部署初始化結構所需的軟件 NVSwitch 系統,包括 NVIDIA HGX A100 和 DGX A100 。一旦初始化,所有 GPU 都可以在全 NVLink 帶寬下相互通信,以創建一個可擴展的終端計算平臺。

    GPU 操作員還經過認證,可在 DGX A100 系統上與 Red Hat OpenShift 4 一起使用。

    支持收集 GPU 操作員狀態指標

    在 1 . 8 版本中, GPU 運營商現在報告各種指標,供用戶監控 GPU 運營商和 GPU – 運營商資源命名空間下的運營商部署資源的總體運行狀況。 SRE 團隊和集群管理員現在可以配置必要的 Prometheus 用于收集指標以及在某些故障情況下觸發警報的資源。

    對于 OpenShift 容器平臺,這些資源將在此版本中自動創建。監控解決方案,如 Grafana 可用于構建儀表板和可視化 GPU 操作員和節點組件的操作狀態。

    更好地結合: NVIDIA 加速計算和聯網

    最近, NVIDIA 發布了 NVIDIA Network Operator . 模擬 NVIDIA GPU Operator ,網絡運營商通過自動化網絡部署和配置的各個方面簡化了 Kubernetes 的擴展網絡設計,否則需要手動操作。它在具有 NVIDIA 網絡接口的任何群集節點上加載所需的驅動程序、庫、設備插件和 CNI 。

    當它們一起部署時, NVIDIA GPU 和網絡運營商啟用 GPU 直接 RDMA ,即不同節點上 NVIDIA GPU 之間的快速數據路徑。這是數據密集型工作負載(如 AI 多節點培訓)的關鍵技術促成因素。

    了解有關最新版本的更多信息 NVIDIA 網絡運營商發布 .

    增加了對 Red Hat OpenShift 的支持

    我們繼續支持紅帽 OpenShift 。

    • GPU Operator 1 . 8 和 1 . 7 支持 Red Hat OpenShift 4 . 8 和 4 . 7
    • GPU 運算符 1 . 6 支持 Red Hat OpenShift 4 . 7
    • GPU 運算符 1 . 5 支持 Red Hat OpenShift 4 . 6
    • GPU Operator 1 . 4 和 1 . 3 分別支持 Red Hat OpenShift 4 . 5 和 4 . 4

    概括

    以下資源可用于使用 NVIDIA GPU 運算符:

    NVIDIA GPU 運算符是許多應用程序的關鍵組件 邊緣計算 解決。了解有關 NVIDIA 解決方案的更多信息 邊緣計算 .

    ?

    0

    標簽

    人人超碰97caoporen国产