LLM

2025年 4月 16日
使用 NVIDIA NIM 構建 AI 驅動的自動引用驗證工具
引文的準確性對于保持學術和 AI 生成內容的完整性至關重要。當引用不準確或錯誤時,它們可能會誤導讀者并散布虛假信息。
2 MIN READ

2025年 4月 16日
宣布推出基于 CUDA 評估 LLM 的開源框架 ComputeEval
大語言模型 (LLMs) 正在徹底改變開發者的編碼方式和編碼學習方式。對于經驗豐富的或初級的開發者來說,
1 MIN READ

2025年 4月 9日
在 NVIDIA NeMo Guardrails 中使用 Cleanlab 可信語言模型防止 LLM 幻覺
隨著越來越多的企業將 Large Language Models (LLM) 集成到其應用中,他們面臨著一個嚴峻的挑戰:
3 MIN READ

2025年 4月 8日
使用先進的開放式 NVIDIA Llama Nemotron 推理模型構建企業 AI 智能體
此更新文章最初發布于 2025 年 3 月 18 日 。 企業組織正在采用 AI 智能體 來提高生產力并簡化運營。為了更大限度地發揮影響,
3 MIN READ

2025年 4月 2日
LLM 基準測試:基本概念
在過去幾年中,作為廣泛的 AI 革命的一部分, 生成式 AI 和 大語言模型 (LLMs) 越來越受歡迎。
4 MIN READ

2025年 4月 2日
NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍
在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下, 大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時,
3 MIN READ

2025年 3月 26日
部署 NVIDIA AI Blueprint 實現成本高效的大語言模型路由
自 2022 年 11 月 ChatGPT 發布以來, 大語言模型 (LLMs) 的能力激增,可用模型數量呈指數級增長。隨著此次擴展,
2 MIN READ

2025年 3月 20日
借助 NVIDIA TensorRT-LLM 提升 Microsoft Azure AI Foundry 的 Llama 模型性能
微軟與 NVIDIA 合作,宣布在其 Azure AI Foundry 平臺上實現 Meta Llama 系列模型的變革性性能提升。
1 MIN READ

2025年 3月 19日
NVIDIA 虛擬 GPU 18.0 可在每個虛擬化平臺上實現適用于 AI 的 VDI
NVIDIA 虛擬 GPU (vGPU) 技術可在虛擬桌面基礎架構 (VDI) 中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。
1 MIN READ

2025年 3月 18日
隆重推出 NVIDIA Dynamo:用于擴展推理AI模型的低延遲分布式推理框架
NVIDIA 今天在 GTC 2025 宣布發布 NVIDIA Dynamo 。NVIDIA Dynamo 是一個高吞吐量、
4 MIN READ

2025年 3月 18日
NVIDIA Blackwell 實現世界紀錄的 DeepSeek-R1 推理性能
NVIDIA 在 NVIDIA GTC 2025 上宣布了創下世界紀錄的 DeepSeek-R1 推理性能 。 搭載 8 個 NVIDIA…
5 MIN READ

2025年 3月 18日
使用先進的開放式 NVIDIA Llama Nemotron 推理模型構建企業級 AI 智能體
企業組織正在采用 AI 智能體 來提高生產力并簡化運營。為了更大限度地發揮影響,這些智能體需要強大的推理能力來解決復雜的問題,發現隱藏的聯系,
3 MIN READ

2025年 3月 18日
使用 NVIDIA AgentIQ 開源工具包改進 AI 代碼生成
隨著 NVIDIA AgentIQ (用于連接和優化 AI 智能體團隊的開源庫) 的發布,開發者、
4 MIN READ

2025年 3月 18日
NVIDIA NeMo 檢索器將準確的多模態 PDF 數據提取速度提高 15 倍
企業生成和存儲的多模態數據比以往任何時候都多,但傳統的檢索系統在很大程度上仍然以文本為重點。雖然他們可以從書面內容中獲得見解,
3 MIN READ

2025年 3月 18日
借助 NVIDIA DGX 云基準測試衡量和提高 AI 工作負載性能
隨著 AI 功能的進步,了解硬件和軟件基礎架構選擇對工作負載性能的影響對于技術驗證和業務規劃都至關重要。
2 MIN READ

2025年 3月 18日
借助 NVIDIA DGX 云無服務器推理在云環境中無縫擴展人工智能
NVIDIA DGX Cloud Serverless Inference 是一種自動擴展 AI 推理解決方案,可實現快速可靠的應用部署。
3 MIN READ