NIM

2025年 5月 21日

NVIDIA Dynamo 加速 llm-d 社區計劃，推動大規模分布式推理

在 Red Hat Summit 2025 上推出的 llm-d 社區標志著開源生態系統在加速生成式 AI 推理創新方面邁出了重要一步。

1 MIN READ

2025年 5月 16日

借助 Mistral Medium 3 和 NVIDIA NIM 構建智能體并了解長文檔

構建功能強大的多模態應用的開發者現在可以使用 Mistral Medium 3，獲得專為企業級性能而設計的全新先進模型。

1 MIN READ

2025年 5月 12日

在 Azure AI Foundry 上使用 NVIDIA NIM 加速 AI 推理

將 NVIDIA NIM 微服務集成到 Azure AI Foundry ，標志著企業 AI 開發的重大飛躍。

4 MIN READ

2025年 5月 6日

LLM 推理基準測試指南：NVIDIA GenAI-Perf 和 NIM

這是 LLM 基準測試系列的第二篇文章，介紹了在使用 NVIDIA NIM 部署 Meta Llama 3 模型時，

4 MIN READ

2025年 4月 29日

NVIDIA NIM Operator 2.0 借助 NVIDIA NeMo 微服務支持提高 AI 部署效率

NVIDIA 的首個版本 NIM 運算符簡化了推理工作流的部署和生命周期管理 NVIDIA NIM 微服務，減少 MLOps、

2 MIN READ

2025年 4月 29日

聚焦：個人 AI 借助 NVIDIA Riva 為小企業主帶來 AI 接待員

星期二晚上 10 點，Sapochnick Law Firm (一家位于加利福尼亞州圣地亞哥的專業律師事務所) 的電話鈴響了。

2 MIN READ

2025年 4月 24日

使用 NVIDIA NIM 對游戲進行代理式 LLM 和 VLM 推理基準測試

這是 LLM 基準測試系列的第一篇文章，介紹了在使用 NVIDIA NIM 部署 Meta Llama 3 模型時，

2 MIN READ

2025年 4月 23日

使用 NVIDIA NeMo 微服務，通過數據飛輪增強 AI 智能體

企業數據不斷變化。隨著時間的推移，這給保持 AI 系統的準確性帶來了重大挑戰。隨著企業組織越來越依賴代理式 AI 系統來優化業務流程，

4 MIN READ

2025年 4月 16日

使用 NVIDIA NIM 構建 AI 驅動的自動引用驗證工具

引文的準確性對于保持學術和 AI 生成內容的完整性至關重要。當引用不準確或錯誤時，它們可能會誤導讀者并散布虛假信息。

2 MIN READ

2025年 4月 15日

NVIDIA Llama Nemotron 超開放模型實現突破性的推理準確性

AI 不再只是生成文本或圖像，而是要針對商業、金融、客戶和醫療健康服務中的現實應用進行深度推理、詳細解決問題并實現強大的適應性。

2 MIN READ

2025年 4月 9日

在 NVIDIA NeMo Guardrails 中使用 Cleanlab 可信語言模型防止 LLM 幻覺

隨著越來越多的企業將 Large Language Models (LLM) 集成到其應用中，他們面臨著一個嚴峻的挑戰：

3 MIN READ

2025年 4月 9日

借助 Rafay 為企業 AI 工作負載提供 NVIDIA 加速計算

生成式 AI 在全球的應用推動了全球對加速計算硬件的巨大需求。在企業中，這加快了加速私有云基礎設施的部署。在地區層面，

2 MIN READ

2025年 4月 5日

NVIDIA 加速推理 Meta Llama 4 Scout 與 Maverick 模型

最新一代熱門 Llama AI 模型現已支持 Llama 4 Scout 和 Llama 4 Maverick。

2 MIN READ

2025年 4月 2日

LLM 基準測試：基本概念

在過去幾年中，作為廣泛的 AI 革命的一部分，生成式 AI 和大語言模型 (LLMs) 越來越受歡迎。

4 MIN READ

2025年 3月 26日

部署 NVIDIA AI Blueprint 實現成本高效的大語言模型路由

自 2022 年 11 月 ChatGPT 發布以來，大語言模型 (LLMs) 的能力激增，可用模型數量呈指數級增長。隨著此次擴展，

2 MIN READ

2025年 3月 25日

借助 NVIDIA NIM 微服務，在 RTX AI PC 和工作站上開啟您的 AI 之旅

隨著數字人、智能體、播客、圖像和視頻生成等新興用例的出現，生成式 AI 正在改變我們與 PC 的交互方式。

2 MIN READ