Author:

3 月 19 日下午 2 點，鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看

Nick Comly

Nick Comly 是 NVIDIA 深度學習推理的產品經理。他致力于將 TensorRT 推理優化的功能直接應用于 PyTorch 、 TensorFlow 、 MXNet 、 ONNX 和飛漿等框架。 Nick 在斯坦福大學獲得碩士學位，專攻深度學習和優化。

數據中心/云端 2024年 12月 24日

AI 驅動的應用的爆炸式發展對開發者提出了前所未有的要求，他們必須在提供先進的性能與管理運營復雜性和成本以及 AI 基礎設施之間取得平衡。 2 MIN READ

數據中心/云端 2024年 11月 19日

Meta 最近發布了 Llama 3.2 系列視覺語言模型（VLM），其中包含 11B 參數和 90B 參數變體。這些模型是多模態模型， 2 MIN READ

數據中心/云端 2024年 11月 15日

在本博文中，我們詳細介紹了分塊預填充，這是 NVIDIA TensorRT-LLM 的一項功能， 1 MIN READ

AI 平臺/部署 2024年 11月 8日

在上一篇博客文章中，我們展示了通過將鍵值 (KV) 緩存卸載到 CPU 內存來重復使用該緩存如何在基于 x86 的 NVIDIA… 2 MIN READ

數據中心/云端 2024年 8月 12日

大型語言模型（LLM）越來越大，增加了處理推理請求所需的計算量。為了滿足服務當今LLM的實時延遲要求，并為盡可能多的用戶提供服務， 3 MIN READ

數據中心/云端 2024年 5月 14日

NVIDIA 今天宣布最新發布的 NVIDIA TensorRT，一個用于高性能深度學習推理的 API 生態系統。 2 MIN READ