H100

2025年 4月 23日

NVIDIA Secure AI 正式發布

隨著許多企業開始對其數據進行 AI 訓練或推理，需要保護數據和代碼，尤其是大語言模型 (LLMs) 。由于數據敏感性，

1 MIN READ

2025年 4月 16日

AI 生成的熱圖可保護老年人及其隱私

到 2030 年，超過五分之一的美國人將年滿 65 歲，成為美國有史以來最大的老年人群體。位于硅谷的初創公司 Butlr 開發了一個 AI…

1 MIN READ

2025年 4月 5日

NVIDIA 加速推理 Meta Llama 4 Scout 與 Maverick 模型

最新一代熱門 Llama AI 模型現已支持 Llama 4 Scout 和 Llama 4 Maverick。

2 MIN READ

2025年 4月 2日

NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍

在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下，大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時，

3 MIN READ

2025年 3月 19日

AI 推理時代的 NVIDIA Blackwell Ultra

多年來，AI 的進步一直通過預訓練擴展遵循清晰的軌跡：更大的模型、更多的數據和更豐富的計算資源帶來了突破性的功能。在過去 5 年中，

2 MIN READ

2025年 3月 3日

AI 模型為環保人士提供大規模保護漁業和野生動物的新工具

為了遏制非法捕撈，研究人員發布了一個新的開源 AI 模型，該模型可以準確識別世界上幾乎所有的航海船只的行為，包括船只是否可能非法捕撈。

1 MIN READ

2025年 2月 25日

NVIDIA cuDSS 提高工程和科學計算中的求解器技術

NVIDIA cuDSS 是第一代稀疏直接求解器庫，旨在加速工程和科學計算。cuDSS 正越來越多地應用于數據中心和其他環境，

4 MIN READ

2025年 2月 14日

使用 NVIDIA TensorRT-LLM 前瞻性解碼優化 Qwen2.5-Coder 吞吐量

專注于編碼的大語言模型（LLMs）已穩步應用于開發者工作流程。從配對編程到自我改進的 AI 智能體，這些模型可幫助開發者完成各種任務，

3 MIN READ

2025年 2月 4日

新的 AI 模型提供癌癥細胞級視圖

研究癌癥的研究人員推出了一種新的 AI 模型，該模型提供了癌細胞的細胞級映射和可視化，

1 MIN READ

2025年 1月 29日

借助 AI 驅動的細胞分析技術推進罕見疾病檢測

由于傳統基因組測序的局限性，罕見疾病很難診斷。哥倫比亞大學助理教授 Wolfgang Pernice 正在使用 AI…

1 MIN READ

2025年 1月 24日

動態內存壓縮技術

盡管大語言模型（LLMs）作為通用 AI 工具取得了成功，但其對計算資源的高需求使其在許多真實場景中的部署具有挑戰性。

3 MIN READ

2024年 12月 19日

AI 視覺技術助力綠色回收工廠智能化

全球每年僅回收約 13% 的 20 多億噸城市垃圾。到 2050 年，全球每年的城市廢棄物量將達到 3.88 億噸。

1 MIN READ

2024年 12月 5日

聚焦：Perplexity AI 利用 NVIDIA 推理棧每月服務 4 億個搜索請求

對 AI 賦能服務的需求持續快速增長，這給 IT 和基礎設施團隊帶來了越來越大的壓力。這些團隊的任務是配置必要的硬件和軟件來滿足這一需求，

2 MIN READ

2024年 11月 14日

NVIDIA DOCA 2.9 借助新性能和安全功能強化人工智能和云計算基礎設施

NVIDIA DOCA 通過為開發者提供全面的軟件框架來利用硬件加速來增強 NVIDIA 網絡平臺的功能，從而提高性能、安全性和效率。

2 MIN READ

2024年 11月 14日

探索采用自主 AI 和 NVIDIA 機密計算的超級協議案例

機密和自主的 AI 是一種新的 AI 開發、訓練和推理方法，其中用戶的數據是去中心化的、私有的，并由用戶自己控制。

3 MIN READ

2024年 11月 8日

NVIDIA TensorRT-LLM KV 緩存早期重用實現首個令牌速度 5 倍提升

在上一篇博客文章中，我們展示了通過將鍵值 (KV) 緩存卸載到 CPU 內存來重復使用該緩存如何在基于 x86 的 NVIDIA…

2 MIN READ