云服務

2025年 2月 11日
NVIDIA DGX 云推出即用型模板,更好地評估 AI 平臺性能
在快速發展的 AI 系統和工作負載環境中,實現出色的模型訓練性能遠遠超出芯片速度。這需要對整個堆棧進行全面評估,從計算到網絡,再到模型框架。
2 MIN READ

2025年 2月 5日
NVIDIA Blackwell 上的 OpenAI Triton 提升 AI 性能和可編程性
矩陣乘法和注意力機制是現代 AI 工作負載的計算支柱。雖然庫如 NVIDIA cuDNN 提供高度優化的實現,
2 MIN READ

2025年 1月 31日
NVIDIA 集合通信庫 2.23 促使新的縮放算法和初始化方法的誕生
NVIDIA 集合通信庫 (NCCL) 可實現針對 NVIDIA GPU 和網絡進行優化的多 GPU 和多節點通信基元。
2 MIN READ

2025年 1月 13日
借助 NVIDIA DOCA 平臺框架,助力新一代 DPU 加速云基礎設施
越來越多的企業組織開始采用加速計算來滿足生成式 AI、5G 電信和主權云的需求。NVIDIA 發布了 DOCA 平臺框架 (DPF),
2 MIN READ

2024年 12月 24日
借助 NVIDIA 全棧解決方案提升 AI 推理性能
AI 驅動的應用的爆炸式發展對開發者提出了前所未有的要求,他們必須在提供先進的性能與管理運營復雜性和成本以及 AI 基礎設施之間取得平衡。
2 MIN READ

2024年 11月 15日
借助 NVIDIA TensorRT-LLM 分塊預填充提高 AI 推理效率和簡化部署
在本 博文 中,我們詳細介紹了分塊預填充,這是 NVIDIA TensorRT-LLM 的一項功能,
1 MIN READ

2024年 11月 15日
NVIDIA NIM 1.4 現已部署可用,推理速度提升 2.4 倍
隨著 生成式 AI 重塑各行各業,對可立即部署的高性能推理的需求也在不斷增長。 NVIDIA NIM 為 AI…
1 MIN READ

2024年 11月 14日
NVIDIA DOCA 2.9 借助新性能和安全功能強化人工智能和云計算基礎設施
NVIDIA DOCA 通過為開發者提供全面的軟件框架來利用硬件加速來增強 NVIDIA 網絡平臺的功能,從而提高性能、安全性和效率。
2 MIN READ

2024年 11月 1日
NVSwitch 和 TensorRT-LLM MultiShot 共同加速 AllReduce 速度達 3 倍
在用戶數量可能在數百到數十萬之間波動,且輸入序列長度隨每個請求而變化的生產環境中,部署生成式 AI 工作負載會面臨獨特的挑戰。
1 MIN READ

2024年 10月 24日
構建 AI 智能體以自動創建軟件測試案例
在軟件開發中,測試對于確保最終產品的質量和可靠性至關重要。然而,創建測試計劃和規范可能耗時且需要大量人力,
6 MIN READ

2024年 10月 21日
IBM 全新推出的 GRANITE 3.0 生成式 AI 模型:小體積、高準確度、高效率
今天,IBM 發布了第三代 IBM Granite,這是一個開放語言模型和輔助工具的集合。前幾代 Granite 專注于特定領域的用例;
2 MIN READ

2024年 10月 15日
NVIDIA SuperNIC 驅動新一代 AI 網絡發展
在生成式 AI 時代,加速網絡對于為大規模分布式 AI 工作負載構建高性能計算結構至關重要。NVIDIA 在該領域繼續保持領先地位,
1 MIN READ

2024年 10月 7日
NVIDIA 加速庫助力 Microsoft Bing 視覺搜索性能優化
Microsoft Bing 視覺搜索使全球用戶能夠使用照片作為查詢來查找內容。該功能的核心是 Microsoft 的 TuringMM…
3 MIN READ

2024年 9月 17日
AI 智能體與 OODA 循環策略合力優化數據中心運營效率
對于任何數據中心來說,操作大型、復雜的 GPU 集群都不是件容易的事情!這其中存在著巨大的復雜性。在加速計算數據中心,冷卻、電源、網絡,
2 MIN READ

2024年 9月 16日
借助 NVIDIA 集合通信庫實現顯存高效、快速初始化和成本估算優化 2.22
在過去幾個月中,NVIDIA 集合通信庫(NCCL)開發者一直在努力開發一系列新的庫功能和錯誤修復。在本文中,我們將討論 NCCL 2.22…
2 MIN READ

2024年 9月 6日
利用 NVIDIA Magnum IO NVSHMEM 3.0 實現跨平臺應用程序的可移植性和兼容性增強
NVSHMEM 是一個并行編程接口,可為 NVIDIA GPU 集群提供高效且可擴展的通信。NVSHMEM 是 NVIDIA Magnum…
3 MIN READ