NVIDIA 技術博客
-
AI 平臺/部署NVIDIA Dynamo 加速 llm-d 社區計劃,推動大規模分布式推理
-
數據中心/云端NVIDIA 800V HVDC 架構賦能新一代 AI 工廠發展
-
數據中心/云端NVIDIA Dynamo 新增 GPU 自動縮放、Kubernetes 自動化和網絡優化功能
-
機器人使用 NVIDIA Isaac Lab 為工業機器人裝配應用彌合仿真與現實之間的差距
-
AI 平臺/部署NVIDIA TensorRT for RTX 在 Windows 11 上推出優化的推理 AI 庫
最近

2025年 5月 21日
NVIDIA Dynamo 加速 llm-d 社區計劃,推動大規模分布式推理
在 Red Hat Summit 2025 上推出的 llm-d 社區標志著開源生態系統在加速生成式 AI 推理創新方面邁出了重要一步。
1 MIN READ

2025年 5月 20日
NVIDIA 800V HVDC 架構賦能新一代 AI 工廠發展
AI 工作負載的指數級增長正在增加數據中心的功率需求。傳統的 54 V 機架內配電專為千瓦(KW)-scale 機架設計,
2 MIN READ

2025年 5月 20日
NVIDIA Dynamo 新增 GPU 自動縮放、Kubernetes 自動化和網絡優化功能
在 NVIDIA GTC 2025 上,我們宣布推出 NVIDIA Dynamo ,這是一種高吞吐量、低延遲的開源推理服務框架,
2 MIN READ

2025年 5月 20日
使用 NVIDIA Isaac Lab 為工業機器人裝配應用彌合仿真與現實之間的差距
多個部件的組裝在幾乎每個主要行業 (如制造、汽車、航空航天、電子和醫療設備) 中都發揮著關鍵作用。盡管機器人組裝應用廣泛,
3 MIN READ

2025年 5月 19日
NVIDIA TensorRT for RTX 在 Windows 11 上推出優化的推理 AI 庫
在 Windows 上,創意、游戲和生產力應用方面的 AI 體驗正在迅速擴展。有各種框架可用于在臺式機、
3 MIN READ

2025年 5月 19日
聚焦:Atgenomix SeqsLab 提升健康組學分析以支持精準醫療
在傳統的臨床醫學實踐中,治療決策通常基于一般準則、以往經驗和試錯方法。如今,隨著電子病歷 (EMRs) 和基因組數據的訪問,
2 MIN READ

2025年 5月 18日
借助 NVIDIA ARC-Compact 在基站部署 AI-RAN
無線網絡是現代連接的支柱,通過全球數百萬個蜂窩基站為數十億 5G 用戶提供服務。AI-RAN 的機遇和優勢正在推動電信網絡和生態系統向 AI…
3 MIN READ

2025年 5月 18日
NVIDIA ConnectX-8 SuperNIC 通過 PCIe Gen6 連接推動 AI 平臺架構發展
從 大語言模型 (LLM) 到 代理式 AI 推理和 物理 AI ,隨著 AI 工作負載的復雜性和規模不斷增加,人們對更快、
2 MIN READ
增強現實/虛擬現實

2025年 5月 18日
聚焦:Perfect Corp. 利用 NVIDIA TensorRT 和 NVENC 實現個性化的數字化美妝體驗
增強現實 (AR) 和 AI 通過提供從虛擬試用到 AI 驅動的造型推薦等超個性化體驗,正在徹底改變美妝和時尚行業。
1 MIN READ

2025年 5月 6日
借助 NVIDIA RTX PRO Blackwell 臺式機 GPU 實現 Rivian 新一代XR 設計
對于不斷突破 XR 界限的專業人士而言,打造身臨其境的高保真體驗始終充滿挑戰。在渲染大型數據集和驅動最新的超高分辨率高級 XR 頭顯設備時,
2 MIN READ

2025年 3月 5日
借助 NVIDIA Omniverse 將 AR 體驗串流到 Apple iPad
最近在 MWC 巴塞羅那宣布 ,開發者現在可以將使用 NVIDIA Omniverse 構建的增強現實(AR)體驗流式傳輸到 Apple…
1 MIN READ

2025年 2月 24日
在 NVIDIA 視頻編解碼器 SDK 13.0 中使用 MV-HEVC 啟用立體和 3D 視圖
NVIDIA 宣布在最新的 NVIDIA 視頻編解碼器 SDK 版本 13.0 中實施多視圖高效視頻編碼 (MV-HEVC) 編碼器。
2 MIN READ

2025年 1月 6日
利用 NVIDIA Omniverse 空間流,在 XR 中體驗數字孿生技術
空間計算 體驗正在轉變我們與數據的交互方式,通過 擴展現實 (XR) 和 數字孿生 等技術連接物理和數字世界。
2 MIN READ

2024年 10月 24日
利用 NVIDIA Morpheus 加速警報分流和 LLM 代理強化安全運營中心
安全運營中心(SOC)分析師每天都會收到大量傳入的安全警報。為了確保其組織的持續安全,他們的任務是仔細檢查傳入的噪音,分揀出誤報,
1 MIN READ

2024年 10月 22日
多代理 AI 和 GPU 驅動的聲音轉文本技術創新
自動音頻字幕 (Automated Audio Captioning) 任務的核心是從音頻輸入中生成自然語言描述。鑒于輸入 (音頻) 和輸出…
2 MIN READ

2024年 10月 14日
AI 驅動模擬和數字孿生技術助力手術機器人技術創新發展
在手術室中集成機器人手術助手(RSAs)為外科醫生和患者的治療效果帶來了巨大的優勢。目前,
1 MIN READ
數據科學

2025年 5月 15日
使用 cuEmbed 加速嵌入查找
NVIDIA 最近發布了 cuEmbed,這是一個高性能、僅使用標頭的 CUDA 庫,可加速 NVIDIA GPU 上的嵌入查找。
2 MIN READ

2025年 5月 15日
使用 GPU 預測 Apache Spark 的性能
大數據分析領域正在不斷尋找加速處理和降低基礎設施成本的方法。Apache Spark 已成為用于橫向擴展分析的領先平臺,可處理 ETL、
2 MIN READ

2025年 5月 15日
使用 NVIDIA CUDA-X 和 Coiled 簡化云端環境設置并加速數據科學運算
想象一下,分析紐約市數百萬次的拼車旅程 — — 跟蹤各自治市的模式、比較服務定價或確定有利可圖的取車地點。
4 MIN READ

2025年 5月 8日
云端 Apache Spark 加速深度學習和大語言模型推理
Apache Spark 是用于大數據處理和分析的行業領先平臺。隨著非結構化數據(documents、emails、
4 MIN READ

2025年 5月 7日
使用 Python 通過 OpenUSD 實現 3D 工作流自動化
通用場景描述 (OpenUSD) 提供了一個強大、開放且可擴展的生態系統,用于在復雜的 3D 世界中進行描述、合成、仿真和協作。
2 MIN READ

2025年 5月 7日
使用 NVIDIA NeMo Curator 構建 Nemotron-CC:一個高質量萬億令牌數據集,用于大型語言模型預訓練,源自 Common Crawl
對于想要訓練先進的 大語言模型 (LLM) 的企業開發者而言,整理高質量的預訓練數據集至關重要。為了讓開發者能夠構建高度準確的 LLM,
2 MIN READ

2025年 5月 2日
CUDA 入門教程:更簡單的介紹 (更新版)
注意:本博文最初發布于 2017 年 1 月 25 日,但已進行編輯以反映新的更新。 本文非常簡單地介紹了 CUDA,
5 MIN READ

2025年 5月 1日
借助超參數優化實現堆疊泛化:使用 NVIDIA cuML 在15分鐘內最大化準確性
堆疊泛化是機器學習 (ML) 工程師廣泛使用的技術,通過組合多個模型來提高整體預測性能。另一方面,超參數優化 (HPO)…
3 MIN READ