H100

2025年 4月 23日
NVIDIA Secure AI 正式發布
隨著許多企業開始對其數據進行 AI 訓練或推理,需要保護數據和代碼,尤其是大語言模型 (LLMs) 。由于數據敏感性,
1 MIN READ

2025年 4月 16日
AI 生成的熱圖可保護老年人及其隱私
到 2030 年,超過五分之一的美國人將年滿 65 歲,成為美國有史以來最大的老年人群體。 位于硅谷的初創公司 Butlr 開發了一個 AI…
1 MIN READ

2025年 4月 5日
NVIDIA 加速推理 Meta Llama 4 Scout 與 Maverick 模型
最新一代熱門 Llama AI 模型現已支持 Llama 4 Scout 和 Llama 4 Maverick。
2 MIN READ

2025年 4月 2日
NVIDIA Blackwell 在 MLPerf Inference v5.0 中實現巨大的性能飛躍
在不斷增長的模型大小、實時延遲要求以及最近的 AI 推理的推動下, 大語言模型 (LLM) 推理的計算需求正在快速增長。與此同時,
3 MIN READ

2025年 3月 19日
AI 推理時代的 NVIDIA Blackwell Ultra
多年來,AI 的進步一直通過預訓練擴展遵循清晰的軌跡:更大的模型、更多的數據和更豐富的計算資源帶來了突破性的功能。在過去 5 年中,
2 MIN READ

2025年 3月 3日
AI 模型為環保人士提供大規模保護漁業和野生動物的新工具
為了遏制非法捕撈,研究人員發布了一個新的開源 AI 模型,該模型可以準確識別世界上幾乎所有的航海船只的行為,包括船只是否可能非法捕撈。
1 MIN READ

2025年 2月 25日
NVIDIA cuDSS 提高工程和科學計算中的求解器技術
NVIDIA cuDSS 是第一代稀疏直接求解器庫,旨在加速工程和科學計算。cuDSS 正越來越多地應用于數據中心和其他環境,
4 MIN READ

2025年 2月 14日
使用 NVIDIA TensorRT-LLM 前瞻性解碼優化 Qwen2.5-Coder 吞吐量
專注于編碼的 大語言模型(LLMs) 已穩步應用于開發者工作流程。從配對編程到自我改進的 AI 智能體 ,這些模型可幫助開發者完成各種任務,
3 MIN READ

2025年 2月 4日
新的 AI 模型提供癌癥細胞級視圖
研究癌癥的研究人員推出了一種新的 AI 模型,該模型提供了癌細胞的細胞級映射和可視化,
1 MIN READ

2025年 1月 29日
借助 AI 驅動的細胞分析技術推進罕見疾病檢測
由于傳統基因組測序的局限性,罕見疾病很難診斷。哥倫比亞大學助理教授 Wolfgang Pernice 正在使用 AI…
1 MIN READ

2025年 1月 24日
動態內存壓縮技術
盡管大語言模型(LLMs)作為通用 AI 工具取得了成功,但其對計算資源的高需求使其在許多真實場景中的部署具有挑戰性。
3 MIN READ

2024年 12月 19日
AI 視覺技術助力綠色回收工廠智能化
全球每年僅回收約 13% 的 20 多億噸城市垃圾。到 2050 年,全球每年的城市廢棄物量將達到 3.88 億噸。
1 MIN READ

2024年 12月 5日
聚焦:Perplexity AI 利用 NVIDIA 推理棧每月服務 4 億個搜索請求
對 AI 賦能服務的需求持續快速增長,這給 IT 和基礎設施團隊帶來了越來越大的壓力。這些團隊的任務是配置必要的硬件和軟件來滿足這一需求,
2 MIN READ

2024年 11月 14日
NVIDIA DOCA 2.9 借助新性能和安全功能強化人工智能和云計算基礎設施
NVIDIA DOCA 通過為開發者提供全面的軟件框架來利用硬件加速來增強 NVIDIA 網絡平臺的功能,從而提高性能、安全性和效率。
2 MIN READ

2024年 11月 14日
探索采用自主 AI 和 NVIDIA 機密計算的超級協議案例
機密和自主的 AI 是一種新的 AI 開發、訓練和推理方法,其中用戶的數據是去中心化的、私有的,并由用戶自己控制。
3 MIN READ

2024年 11月 8日
NVIDIA TensorRT-LLM KV 緩存早期重用實現首個令牌速度 5 倍提升
在上一篇 博客文章 中,我們展示了通過將鍵值 (KV) 緩存卸載到 CPU 內存來重復使用該緩存如何在基于 x86 的 NVIDIA…
2 MIN READ