NVIDIA Base Command 平臺 提供了日益精簡的軟件服務工作流程,旨在加速 AI 開發。本文將介紹近期添加的一些新功能,包括:
- 一鍵式環境部署,快速入門
- 用于輕計算任務的 CPU 節點
- 借助 Data Mover 高效提取數據
- 使用機密管理服務 (SMS) 保護數據和協作工作流程
輕松進行環境初始化
在超級計算機上啟動探索環境從未如此簡單。
借助“Quick Start”(快速啟動)功能,團隊可以以編程方式定義其常用配置,從 GPU 和 CPU 實例類型、內存和存儲需求到添加數據集、工作空間、交換容器,甚至設置默認命令。這些都定義為一個模板,只需在 Base Command 控制面板中單擊一下即可啟動。
除了自己構建模板外,您還可以利用 NVIDIA 構建的快速入門目錄。JupyterLab 和 Dask+RAPIDS 的默認快速入門現已推出。隨著目錄的不斷發展,數據科學家現在使用的各種工具集將更易于使用 GPU 加速的數據科學。
軟件和硬件的深度集成是 Base Command Platform 的核心原則,快速啟動也不例外。 NVIDIA 自定義調度程序可確保在集群中適當路由這些用戶定義的環境需求,以確保所有作業的高集群利用率。Base Command Platform 使困難的事情變得簡單。
支持各種工作負載
CPU 實例現已在 Base Command Platform 中提供。將 CPU 和 GPU 實例添加到加速計算環境 (ACE) 可為 AI 工作流程帶來靈活性、優化和成本效益。
CPU 實例非常適合執行不需要 GPU 計算強度的預處理和數據整理任務。然后 GPU 實例可以免費用于訓練等計算密集型任務。
使用 Base Command Platform 中的 CPU 節點執行各種任務,從下載數據集和運行 Notebook 到編輯代碼、瀏覽數據集內的文件,甚至運行 TensorBoard 等監控工具。
您還可以在 Base Command Platform 中跨 CPU 和 GPU 節點獲得無縫體驗。CPU 實例可以利用與 GPU 工作負載關聯的現有結構,例如與共享資源(例如數據集)的交互。與現有 GPU 體驗一樣,您將獲得默認 CPU 配額、運行時間限制,并能夠在用戶界面中體驗 CPU 遙測。
要在 Base Command Platform 中為您的組織請求 CPU 節點,請聯系您的客戶團隊。
簡化數據導入和導出
借助 Data Mover 功能,在 Base Command Platform 中管理數據工作流程比以往更簡單。
Data Mover 支持將外部對象數據集直接導入 Base Command 平臺存儲,通過 NVIDIA NGC CLI。雖然 Base Command Platform 支持在訓練作業期間連接外部對象數據集,但團隊通常會選擇將數據集引入 Base Command Platform,以利用我們針對 ACE 內部計算相鄰存儲進行的性能優化。
Data Mover 與我們都非常關心的兩個方面有著密切的聯系:利用率和安全性。Data Mover 使團隊能夠在 CPU 節點上執行數據處理工作,從而使 GPU 節點能夠自由參與計算密集型工作負載。wget 永遠不應束縛 GPU 周期。在安全方面,Data Mover 要求使用指定的密鑰設置 NGC Secret.
現已提供以下功能:數據集導入、數據集導出和工作空間導出。自定義默認 Dask+ NVIDIA RAPIDS Quick Start 和定義重復數據移動作業的能力強強聯合。
安全協作工作流程
在應用程序中處理 API 密鑰或令牌等敏感數據是一個關鍵問題。您可以將安全最佳實踐設為默認做法,同時仍然提供有趣的協作功能。
Secrets Management Service (SMS) 與 Base Command Platform 作業集成,支持直接注入隱藏的環境變量。除非您決定將信息顯示出來,否則信息將保持隱私狀態。
此時,組織必須啟用 Secrets Management 才能使用 SMS.啟用后,可以通過 Web UI 設置頁面和版本 3.21.1 的 NGC CLI 訪問 SMS.
總結
NVIDIA Base Command Platform 使團隊能夠簡化 NVIDIA GPU 上的高性能工作負載。借助最近添加的功能,您可以快速初始化作業、更好地管理數據工作流、支持各種工作負載,并保護敏感信息。
- 開始體驗 NVIDIA DGX 云 和 Base Command Platform。
- 閱讀 借助 NVIDIA Base Command Platform 簡化 AI 開發 以詳細了解 NVIDIA Base Command Platform。
- 查看 NVIDIA Base Command Platform 文檔 和 版本說明。
- 觀看 NVIDIA Base Command Platform 的演示視頻。
- 加入對話,訪問 NVIDIA 開發者論壇。
?