Cumulus Linux – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Tue, 18 Feb 2025 06:14:45 +0000
zh-CN
hourly
1
196178272 -
NVIDIA Spectrum-X 網絡平臺和合作伙伴提升 AI 存儲性能達48%
http://www.open-lab.net/zh-cn/blog/accelerating-ai-storage-by-up-to-48-with-nvidia-spectrum-x-networking-platform-and-partners/
Tue, 04 Feb 2025 06:56:25 +0000
http://www.open-lab.net/zh-cn/blog/?p=12761
Continued]]>
AI 工廠依靠的不僅僅是計算網。當然,連接 GPU 的東西向網絡對于 AI 應用的性能至關重要,而連接高速存儲陣列的存儲網也不容忽視。存儲性能在運行 AI 業務過程中的多個階段中發揮著關鍵作用, 包括訓練過程中的Checkpoint操作、 推理過程中的檢索增強生成 (RAG) 等。 為了滿足這些需求,NVIDIA 和存儲生態合作伙伴正在將 NVIDIA Spectrum-X 網絡平臺 擴展到數據存儲網,從而帶來更高的性能和更快的實現AI的時間。由于 Spectrum-X 動態路由技術能夠緩解網絡中的流量沖突并增加有效帶寬,從而使存儲性能遠高于 RoCE v2,RoCE v2是大多數數據中心用于 AI 計算網和存儲網的以太網網絡協議。 Spectrum-X 將讀取帶寬加速了高達 48%,寫入帶寬加速了高達 41%。帶寬的增加可以更快地完成 AI 工作流中與存儲相關的操作,
Source
]]>
12761
-
簡化 Cumulus Linux 遷移
http://www.open-lab.net/zh-cn/blog/simplifying-cumulus-linux-migrations/
Thu, 07 Mar 2024 08:47:02 +0000
http://www.open-lab.net/zh-cn/blog/?p=9251
Continued]]>
軟件的主要版本之間的遷移可能會對基礎設施管理團隊帶來幾個挑戰: 這些挑戰可能會阻礙用戶采用新版本,因此他們將錯過更新、更強大的功能。有效的規劃和全面的測試對于克服這些挑戰并確保順暢過渡至關重要。 基于 Spectrum 硬件的 Cumulus Linux 3.7.x 和 4.x.y 版本即將結束其支持生命周期,而數據中心交換機預計將遷移到 NVIDIA Cumulus Linux 5.x。新版本的 Cumulus Linux 還使用 NVIDIA 用戶體驗 (NVUE) 與交換機進行交互,這更加凸顯了無縫遷移計劃的重要性。 NVDIA 用戶體驗 (NVUE) 是一個完整的硬件和軟件系統的目標式、模式驅動型模型。它提供一個穩健的 API,允許多個接口在運行 NVUE 軟件的系統中查看 (顯示) 和配置 (設置和取消設置) 任何元件 .
Source
]]>
9251
-
借助 NVIDIA NVUE 和 Ansible 實現數據中心網絡自動化
http://www.open-lab.net/zh-cn/blog/automating-data-center-networks-with-nvidia-nvue-and-ansible/
Mon, 11 Dec 2023 04:46:06 +0000
http://www.open-lab.net/zh-cn/blog/?p=8482
Continued]]>
數據中心自動化可以追溯到大型機的早期,運營效率是其優勢之一。多年來,數據中心內外的技術都發生了變化。因此,工具和方法也發生了變化。 NVIDIA NVUE 集合 和 Ansible 旨在通過提供全面的模塊和角色列表來簡化您的網絡自動化之旅,使您能夠在自己的環境中輕松地開始使用參考拓撲。 NVIDIA User Experience (NVUE) 是一個面向對象、模式驅動的完整硬件和軟件系統模型。它提供穩健的 API,支持多個接口來查看(顯示)和配置(設置和取消設置)運行 NVUE 軟件的系統中的任何元素。NVIDIA Cumulus Linux 5.x 包括 NVUE 模型。 NVUE 是一個 API 優先的結構化對象模型,可簡化操作。它提供聲明性命令行界面 (CLI) 和單個配置文件。CLI 和 REST API 在功能上具有同等效力。
Source
]]>
8482
人人超碰97caoporen国产