kubernetes

2025年 4月 29日
NVIDIA NIM Operator 2.0 借助 NVIDIA NeMo 微服務支持提高 AI 部署效率
NVIDIA 的首個版本 NIM 運算符 簡化了推理工作流的部署和生命周期管理 NVIDIA NIM 微服務,減少 MLOps、
2 MIN READ

2025年 4月 1日
NVIDIA 開源 Run:ai 調度程序以推動社區協作
今天,NVIDIA 宣布推出 KAI Scheduler 的開源版本,這是一種 Kubernetes-native GPU 調度解決方案,
3 MIN READ

2025年 3月 31日
Volcano 調度程序中防止 GPU 碎片的實用技巧
在 NVIDIA,我們以精準和創新解決復雜的基礎設施挑戰為豪。當 Volcano 在其 NVIDIA DGX 云調配的 Kubernetes…
3 MIN READ

2025年 3月 25日
借助 NVIDIA Mission Control 實現 AI 工廠自動化
DeepSeek-R1 等先進的 AI 模型證明,企業現在可以構建專用于自己的數據和專業知識的尖端 AI 模型。
2 MIN READ

2025年 3月 5日
借助 NVIDIA NIM 和 NVIDIA Holoscan for Media 增強直播媒體工作流程效率
NVIDIA Holoscan for Media 是一個 NVIDIA 加速平臺,專為多供應商實時制作和 AI 而設計。
2 MIN READ

2025年 1月 22日
在 Kubernetes 上實現 NVIDIA NIM 微服務的水平自動縮放
NVIDIA NIM 微服務是可部署在 Kubernetes 上的模型推理容器。在生產環境中,
3 MIN READ

2025年 1月 13日
借助 NVIDIA DOCA 平臺框架,助力新一代 DPU 加速云基礎設施
越來越多的企業組織開始采用加速計算來滿足生成式 AI、5G 電信和主權云的需求。NVIDIA 發布了 DOCA 平臺框架 (DPF),
2 MIN READ

2024年 12月 5日
聚焦:Perplexity AI 利用 NVIDIA 推理棧每月服務 4 億個搜索請求
對 AI 賦能服務的需求持續快速增長,這給 IT 和基礎設施團隊帶來了越來越大的壓力。這些團隊的任務是配置必要的硬件和軟件來滿足這一需求,
2 MIN READ

2024年 10月 22日
利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 實現 LLM 擴展
大語言模型 (LLMs) 已廣泛應用于聊天機器人、內容生成、摘要、分類、翻譯等領域。State-of-the-art LLMs 和基礎模型如…
5 MIN READ

2024年 10月 16日
借助 NVIDIA 云原生堆棧實現 AI 應用開發簡化
在快速發展的 AI 和數據科學領域,對可擴展、高效且靈活的基礎設施的需求從未如此高。傳統基礎設施通常難以滿足現代 AI 工作負載的需求,
1 MIN READ

2024年 10月 16日
借助 Google Kubernetes Engine 和 NVIDIA NIM 實現高性能 AI 推理擴展
AI 模型的快速演進推動了對更高效、更可擴展的推理解決方案的需求。在企業組織努力利用 AI 的強大功能時,他們在部署、
3 MIN READ

2024年 9月 30日
使用 NVIDIA NIM Operator 在 Kubernetes 上管理 AI 推理流程
NVIDIA NIM 微服務 是一套易于使用的云原生微服務,可縮短產品上市時間,并簡化生成式 AI 模型在云、數據中心、
2 MIN READ

2024年 9月 2日
使用 NVIDIA NIM 在阿里云容器服務(ACK)中加速 LLM 推理
大語言模型(LLM)是近年來發展迅猛并且激動人心的熱點話題,引入了許多新場景,滿足了各行各業的需求。隨著開源模型能力的不斷增強,
4 MIN READ

2024年 3月 27日
借助 NVIDIA NeMo 定制器輕松微調和對齊 LLM
隨著 大型語言模型(LLM) 在企業 AI 應用中獲得更多吸引力,定制化模型 理解和集成特定行業術語、
1 MIN READ

2024年 3月 18日
如何通過四個步驟將 RAG 應用程序從試點階段轉變為生產階段
生成式 AI 具有改變各個行業的巨大潛力。人類工作者已經開始使用 大型語言模型(LLM) 來解釋、推理和解決復雜的認知任務。
2 MIN READ

2024年 3月 12日
借助 NVIDIA Holoscan for Media 中的新功能簡化直播媒體應用程序開發
適用于媒體的 NVIDIA Holoscan 是一個軟件定義的平臺,用于構建和部署適用于直播媒體的應用程序。
1 MIN READ