NCCL

2025年 1月 31日
NVIDIA 集合通信庫 2.23 促使新的縮放算法和初始化方法的誕生
NVIDIA 集合通信庫 (NCCL) 可實現針對 NVIDIA GPU 和網絡進行優化的多 GPU 和多節點通信基元。
2 MIN READ

2024年 10月 25日
利用 NVIDIA SHARP 網絡計算提升系統性能
AI 和科學計算應用是分布式計算問題的絕佳示例。這些問題太大了,計算太密集,無法在單臺機器上運行。這些計算被分解為并行任務,
2 MIN READ

2024年 9月 16日
借助 NVIDIA 集合通信庫實現顯存高效、快速初始化和成本估算優化 2.22
在過去幾個月中,NVIDIA 集合通信庫(NCCL)開發者一直在努力開發一系列新的庫功能和錯誤修復。在本文中,我們將討論 NCCL 2.22…
2 MIN READ

2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 實現跨平臺應用程序的可移植性和兼容性增強
NVSHMEM 是一個并行編程接口,可為 NVIDIA GPU 集群提供高效且可擴展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ

2024年 4月 26日
使用張量并行技術進行自動駕駛感知模型訓練
由于采用了多攝像頭輸入和深度卷積骨干網絡,用于訓練自動駕駛感知模型的 GPU 內存占用很大。
3 MIN READ

2024年 3月 6日
CUDA 工具包 12.4 增強對 NVIDIA Grace Hopper 和機密計算的支持
最新版本的 CUDA 工具包,即 版本 12.4,繼續利用最新的 NVIDIA GPU 來推動加速計算性能。
3 MIN READ

2023年 10月 12日
適用于數據中心和 AI 時代的網絡
十多年來,傳統的云數據中心一直是計算基礎設施的基石,滿足了各種用戶和應用程序的需求。然而,近年來,
1 MIN READ

2023年 5月 29日
使用 NVIDIA Spectrum-X 網絡平臺進行渦輪增壓生成 AI 工作負載
大型語言模型( LLM )和人工智能應用程序,如ChatGPT和 DALL-E 最近出現了快速增長。由于 GPU 、 CPU 、 DPU 、
2 MIN READ

2023年 5月 25日
為網絡管理員導航生成式人工智能
我們都知道人工智能正在改變世界。對于網絡管理員來說,人工智能可以以一些驚人的方式改善日常運營: 然而,
1 MIN READ