H100

2025年 3月 3日
AI 模型為環保人士提供大規模保護漁業和野生動物的新工具
為了遏制非法捕撈,研究人員發布了一個新的開源 AI 模型,該模型可以準確識別世界上幾乎所有的航海船只的行為,包括船只是否可能非法捕撈。
1 MIN READ

2025年 2月 25日
NVIDIA cuDSS 提高工程和科學計算中的求解器技術
NVIDIA cuDSS 是第一代稀疏直接求解器庫,旨在加速工程和科學計算。cuDSS 正越來越多地應用于數據中心和其他環境,
4 MIN READ

2025年 2月 14日
使用 NVIDIA TensorRT-LLM 前瞻性解碼優化 Qwen2.5-Coder 吞吐量
專注于編碼的 大語言模型(LLMs) 已穩步應用于開發者工作流程。從配對編程到自我改進的 AI 智能體 ,這些模型可幫助開發者完成各種任務,
3 MIN READ

2025年 2月 4日
新的 AI 模型提供癌癥細胞級視圖
研究癌癥的研究人員推出了一種新的 AI 模型,該模型提供了癌細胞的細胞級映射和可視化,
1 MIN READ

2025年 1月 29日
借助 AI 驅動的細胞分析技術推進罕見疾病檢測
由于傳統基因組測序的局限性,罕見疾病很難診斷。哥倫比亞大學助理教授 Wolfgang Pernice 正在使用 AI…
1 MIN READ

2025年 1月 24日
動態內存壓縮技術
盡管大語言模型(LLMs)作為通用 AI 工具取得了成功,但其對計算資源的高需求使其在許多真實場景中的部署具有挑戰性。
3 MIN READ

2024年 12月 19日
AI 視覺技術助力綠色回收工廠智能化
全球每年僅回收約 13% 的 20 多億噸城市垃圾。到 2050 年,全球每年的城市廢棄物量將達到 3.88 億噸。
1 MIN READ

2024年 12月 5日
聚焦:Perplexity AI 利用 NVIDIA 推理棧每月服務 4 億個搜索請求
對 AI 賦能服務的需求持續快速增長,這給 IT 和基礎設施團隊帶來了越來越大的壓力。這些團隊的任務是配置必要的硬件和軟件來滿足這一需求,
2 MIN READ

2024年 11月 14日
NVIDIA DOCA 2.9 借助新性能和安全功能強化人工智能和云計算基礎設施
NVIDIA DOCA 通過為開發者提供全面的軟件框架來利用硬件加速來增強 NVIDIA 網絡平臺的功能,從而提高性能、安全性和效率。
2 MIN READ

2024年 11月 14日
探索采用自主 AI 和 NVIDIA 機密計算的超級協議案例
機密和自主的 AI 是一種新的 AI 開發、訓練和推理方法,其中用戶的數據是去中心化的、私有的,并由用戶自己控制。
3 MIN READ

2024年 11月 8日
NVIDIA TensorRT-LLM KV 緩存早期重用實現首個令牌速度 5 倍提升
在上一篇 博客文章 中,我們展示了通過將鍵值 (KV) 緩存卸載到 CPU 內存來重復使用該緩存如何在基于 x86 的 NVIDIA…
2 MIN READ

2024年 10月 8日
Mistral-NeMo-Minitron 8B 模型提供超高精度
本文最初發布于 2024 年 8 月 21 日,但已根據當前數據進行了修訂。 最近,NVIDIA 和 Mistral AI 推出了…
3 MIN READ

2024年 10月 2日
AI 借助零采樣學習發現罕見疾病的現有治療藥物
突破性的藥物再利用 AI 模型可以為醫生和患者帶來新的希望,讓他們嘗試在現有治療方案有限或根本沒有的情況下治療疾病。
1 MIN READ

2024年 9月 25日
Llama 3.2 加速部署從邊緣到云端實現提速
擴展開源 Meta Llama 模型集合,Llama 3.2 集合包括視覺語言模型(VLM)、小語言模型(SLM)和更新版的 Llama…
2 MIN READ

2024年 8月 28日
NVIDIA Blackwell 平臺在 MLPerf Inference v4.1 中創下新的 LLM 推理記錄
大型語言模型 (LLM) 推理是一項全棧挑戰。實現高吞吐量、低延遲推理需要強大的 GPU、高帶寬 GPU 之間的互連、
4 MIN READ

2024年 8月 22日
Jamba 1.5 LLM 混合架構實現出色的推理和長上下文處理能力
AI21 Labs 推出了最新、最先進的 Jamba 1.5 模型系列,這是一個先進的大型語言模型(LLM)集合,
1 MIN READ