GTC March 2025 – NVIDIA 技術博客

GTC March 2025 – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞和內容。 Wed, 26 Mar 2025 06:15:06 +0000 zh-CN hourly 1 196178272 借助 NVIDIA Parabricks 和 NVIDIA AI Blueprints，將基因組學和單細胞分析時間縮短至幾分鐘 http://www.open-lab.net/zh-cn/blog/shrink-genomics-and-single-cell-analysis-time-to-minutes-with-nvidia-parabricks-and-nvidia-blueprints/ Fri, 21 Mar 2025 09:13:19 +0000 http://www.open-lab.net/zh-cn/blog/?p=13269 Continued]]> NVIDIA Parabricks 是一款可擴展的基因組學分析軟件套件，通過加速計算和深度學習解決 omics 挑戰，實現新的科學突破。 NVIDIA Parabricks v4.5 在 NVIDIA GTC 2025 上發布，通過支持最新的 NVIDIA GPU 架構，并通過結合使用 Giraffe 和 DeepVariant 來改進對齊和變體識別，從而支持不斷增長的數據量。該版本還包括改進的功能，并縮短了跨多個行業領先工具 (包括 STAR、FQ2BAM 和 Minimap2) 的分析時間。 Parabricks v4.5 隨附用于基因組學和單細胞分析的全新 NVIDIA AI Blueprints，使生物信息學家和基因組學平臺提供商能夠輕松部署和測試 NVIDIA Parabricks 和 NVIDIA RAPIDS，而無需本地 GPU 或自管理云配置。通過擴展可訪問性，

]]>

13269

使用 NVIDIA Holoscan 3.0 中的動態流控制輕松構建邊緣 AI 應用 http://www.open-lab.net/zh-cn/blog/easily-build-edge-ai-apps-with-dynamic-flow-control-in-nvidia-holoscan-3-0/ Thu, 20 Mar 2025 08:20:15 +0000 http://www.open-lab.net/zh-cn/blog/?p=13248 Continued]]> NVIDIA 在 GTC 2025 上宣布推出實時 AI 傳感器處理平臺 NVIDIA Holoscan 3.0 。這個最新版本提供動態流控制，使開發者能夠設計更強大、更可擴展和更高效的系統。隨著物理 AI 的快速發展，Holoscan 3.0 專為適應而構建，使其能夠比以往更輕松地應對當今動態環境的挑戰。無論您使用的是醫學成像、機器人還是工業傳感器，Holoscan 3.0 都可以更輕松地在邊緣高效處理 AI 工作負載。本文將介紹 Holoscan 3.0 版本中的更新和功能，包括： NVIDIA Holoscan 3.0 引入了 NVIDIA Holoscan SDK 的重大升級，具有動態流控制。借助此功能，您現在可以在運行時修改工作流中的 operator 連接，從而實現更靈活、更具適應性的工作流。與使用固定連接的傳統靜態管道不同，此功能支持動態路由、

]]>

13248

借助 NVIDIA TensorRT-LLM 提升 Microsoft Azure AI Foundry 的 Llama 模型性能 http://www.open-lab.net/zh-cn/blog/boost-llama-model-performance-on-microsoft-azure-ai-foundry-with-nvidia-tensorrt-llm/ Thu, 20 Mar 2025 08:16:07 +0000 http://www.open-lab.net/zh-cn/blog/?p=13245 Continued]]> 微軟與 NVIDIA 合作，宣布在其 Azure AI Foundry 平臺上實現 Meta Llama 系列模型的變革性性能提升。這些進步由 NVIDIA TensorRT-LLM 優化提供支持，在保持模型輸出質量的同時，顯著提高了吞吐量、降低了延遲并提高了成本效益。通過這些改進，Azure AI Foundry 客戶可以實現顯著的吞吐量提升：在模型目錄中的無服務器部署 (Model-as-a-Service) 產品中，Llama 3.3 70B 和 Llama 3.1 70B 模型的吞吐量提高 45%，Llama 3.1 8B 模型的吞吐量提高 34%。更快的令牌生成速度和更低的延遲使聊天機器人、虛擬助理和自動化客戶支持等實時應用程序的響應速度更快、效率更高。這轉化為更好的價格-性能比率，顯著降低了由 LLM 驅動的應用的每個 token 的成本。

]]>

13245

NVIDIA CUDA-Q 助力量子應用研究 http://www.open-lab.net/zh-cn/blog/nvidia-cuda-q-powers-quantum-applications-research/ Thu, 20 Mar 2025 08:01:08 +0000 http://www.open-lab.net/zh-cn/blog/?p=13238 Continued]]> source-zh.html NVIDIA CUDA-Q 平臺旨在簡化混合式加速量子超級計算機的軟件和硬件開發。用戶可以編寫一次代碼，在任何 QPU 或模擬器上進行測試，并加速工作流程的所有部分。這為實現科學突破騰出了時間，而無需等待結果。 CUDA-Q v0.10 具有更多功能和更高的性能，比以往任何時候都更加不可或缺和靈活。例如，用戶現在可以在 Pasqal 的中立原子 QPU 上運行作業，總計四個不同量子比特模式的八個 QPU 后端。CUDA-Q v0.10 現在還支持先進的 NVIDIA Blackwell GPU 。憑借 v0.10 對 NVIDIA GB200 NVL72 及其第五代多節點 NVLink 功能的支持，CUDA-Q 性能現在可以比以往得到進一步提升。基于多個標準化 Quantum Economic Development…

]]>

13238

利用 Oracles 和實驗反饋指導生成式分子設計 http://www.open-lab.net/zh-cn/blog/guiding-generative-molecular-design-with-experimental-feedback-using-oracles/ Wed, 19 Mar 2025 08:56:53 +0000 http://www.open-lab.net/zh-cn/blog/?p=13266 Continued]]> AI 生成化學有可能徹底改變科學家在藥物研發、健康以及材料科學和工程領域的工作方式。研究人員無需借助“化學直覺”手動設計分子或篩選數百萬種現有化學物質，而是可以訓練神經網絡來提出適合所需特性的新型分子結構。這種能力開辟了廣闊的化學空間，這是以前無法系統探索的。雖然一些早期成功表明，生成式 AI 有望通過提出化學家可能沒有考慮過的創造性解決方案來加速創新，但這些成功只是一個開始。生成式 AI 還不是分子設計的靈丹妙藥，將 AI 建議的分子轉化為現實世界通常比一些標題所顯示的困難得多。虛擬設計與現實世界影響之間的差距是當今 AI 驅動的分子設計面臨的核心挑戰。計算生成式化學模型需要實驗反饋和分子模擬來確認其設計的分子是否穩定、可合成且具有功能性。與自駕駛汽車一樣，AI 必須經過真實駕駛數據或高保真模擬的訓練和驗證，才能在不可預測的道路上行駛。

]]>

13266

NVIDIA Aerial Omniverse 數字孿生提升AI原生無線開發和靈活部署能力 http://www.open-lab.net/zh-cn/blog/nvidia-aerial-omniverse-digital-twin-boosts-development-of-ai-native-wireless-and-deployment-flexibility/ Wed, 19 Mar 2025 08:43:19 +0000 http://www.open-lab.net/zh-cn/blog/?p=13260 Continued]]> 在 AI 與先進 5G 和即將推出的 6G 技術融合的推動下，無線行業正處于轉型的邊緣，這些技術可為數十億 AI 驅動的端點提供無與倫比的速度、超低延遲和無縫連接。具體而言，6G 將采用 AI 原生技術，實現集成感知和通信，支持擴展現實和全息接口等沉浸式技術，并借助 AI 將網絡性能、頻譜效率和能效提升到新的水平。要充分發揮 AI 原生 5G 和 6G 無線網絡的潛力，需要在網絡設計、仿真、部署和測試方面采用創新方法。在 NVIDIA GTC 2024 大會上，我們推出了 Aerial Omniverse 數字孿生 (AODT) ，這是一個使用 NVIDIA Omniverse 構建的 AI 原生數字孿生平臺，專為 5G 和 6G 無線系統的前沿研究和開發 (R&D) 而設計。 AODT 的主要特性包括：今年，我們宣布擴展 AODT 功能，

]]>

13260

NVIDIA Earth-2 為阿聯酋的區域 AI 天氣預報提供支持 http://www.open-lab.net/zh-cn/blog/nvidia-earth-2-powers-regional-ai-weather-forecasting-in-the-united-arab-emirates/ Wed, 19 Mar 2025 08:39:11 +0000 http://www.open-lab.net/zh-cn/blog/?p=13257 Continued]]> 在阿聯酋 (UAE) ，極端天氣事件破壞日常生活、延誤航班、危及交通并使城市規劃復雜化。白天的高溫限制了人類在戶外的活動，而濃霧則是導致嚴重且往往致命的車禍的常見原因。與此同時，2024 年是該國 75 年來最強烈的降水事件，在通常干旱的地區引發了嚴重的洪水。 G42 是一家總部位于阿聯酋的領先 AI 和云計算公司，開發了先進的區域生成式 AI 預測系統，能夠以高達 200 米的分辨率預測阿聯酋的各種氣象事件。在本文中，我們展示了 G42 如何使用 NVIDIA GPUs 和 Earth-2 平臺構建此系統。在阿聯酋，區域天氣預報在應對極端天氣事件（例如暴雨、濃霧、沙塵暴和酷熱）帶來的挑戰方面發揮著至關重要的作用，這些事件可能會造成基礎設施損壞，并破壞交通、物流和公共安全。除了這些緊迫的問題之外，局部天氣預報對于能源轉型也至關重要，因為它可以為將可再生能源納入電網提供信息，

]]>

13257

AI 推理時代的 NVIDIA Blackwell Ultra http://www.open-lab.net/zh-cn/blog/nvidia-blackwell-ultra-for-the-era-of-ai-reasoning/ Wed, 19 Mar 2025 08:34:58 +0000 http://www.open-lab.net/zh-cn/blog/?p=13254 Continued]]> 多年來，AI 的進步一直通過預訓練擴展遵循清晰的軌跡：更大的模型、更多的數據和更豐富的計算資源帶來了突破性的功能。在過去 5 年中，預訓練擴展使計算需求以驚人的速度增加了 50M 倍。但是，構建更智能的系統不再只是預訓練更大的模型。相反，它是關于改進它們并讓它們思考。通過將 AI 模型優化為專門任務，后訓練擴展可改進模型，以提供更多對話式響應。使用特定領域的合成數據調整模型，可增強其理解細微上下文并提供準確輸出的能力。合成數據生成作為訓練模型的可用內容沒有上限，這意味著在后訓練擴展中需要大量計算資源。現在，一種增強智能的新縮放定律已經出現：測試時縮放（test-time scaling）。測試時擴展也稱為長思考，可在 AI 推理過程中動態增加計算量，從而實現更深入的推理。AI 推理模型不僅能一次性生成答案，還能積極思考、權衡多種可能性，并實時優化答案。

]]>

13254

NVIDIA 虛擬 GPU 18.0 可在每個虛擬化平臺上實現適用于 AI 的 VDI http://www.open-lab.net/zh-cn/blog/nvidia-virtual-gpu-v18-0-enables-vdi-for-ai-on-every-virtualized-platform/ Wed, 19 Mar 2025 08:25:18 +0000 http://www.open-lab.net/zh-cn/blog/?p=13251 Continued]]> NVIDIA 虛擬 GPU (vGPU) 技術可在虛擬桌面基礎架構 (VDI) 中解鎖 AI 功能，使其比以往更加強大、用途更加廣泛。通過跨虛擬化環境為 AI 驅動的工作負載提供支持，vGPU 可提高工作效率、增強安全性并優化性能。新版軟件可助力企業和開發者進一步推動創新、轉變工作流程，并更大限度地發揮加速計算的潛力。本文將介紹 NVIDIA vGPU 18.0 版本亮點，包括擴展受支持的生態系統平臺、新的 AI vWS 工具包以及針對 GPU 利用率的增強功能。 NVIDIA vGPU 18.0 支持 Microsoft Windows Server 2025，使用戶能夠利用 GPU 分區和跨分布式環境實時遷移等高級管理功能。借助這些功能，用戶可以高效管理多個工作負載、執行硬件維護和升級軟件，而無需中斷虛擬機。此外，NVIDIA vGPU 18.0…

]]>

13251

使用 NVIDIA NeMo 微服務和數據飛輪實現 AI 智能體性能最大化 http://www.open-lab.net/zh-cn/blog/maximize-ai-agent-performance-with-data-flywheels-using-nvidia-nemo-microservices/ Tue, 18 Mar 2025 06:10:07 +0000 http://www.open-lab.net/zh-cn/blog/?p=13339 Continued]]> 隨著代理式 AI 系統的發展并成為優化業務流程的關鍵，開發者必須定期更新這些系統，以適應不斷變化的業務和用戶需求。通過 AI 和人類反饋不斷完善這些智能體，可確保它們保持有效性和相關性。 NVIDIA NeMo 微服務是一種完全加速的企業級解決方案，旨在簡化穩健數據飛輪的創建和維護，幫助 AI 代理保持適應性、高效率和最新狀態。在本文中，我將全面介紹 NVIDIA NeMo 微服務，讓您深入了解其保持 AI 智能體以峰性能運行的關鍵功能。與傳統系統不同，AI 智能體可以自主運行，推理復雜的場景，并在動態環境中做出決策。隨著這些系統的發展，企業開始構建多智能體系統，其中 AI 智能體跨平臺集成并與人類團隊協作以增強運營，保持整個系統的更新以保持相關性和有效性變得越來越具有挑戰性。解決方案在于采用數據飛輪策略，

]]>

13339

NVIDIA cuML 為 scikit-learn 帶來零代碼更改加速 http://www.open-lab.net/zh-cn/blog/nvidia-cuml-brings-zero-code-change-acceleration-to-scikit-learn/ Tue, 18 Mar 2025 05:59:53 +0000 http://www.open-lab.net/zh-cn/blog/?p=13333 Continued]]> Scikit-learn 是應用最廣泛的 ML 庫，因其 API 簡單、算法多樣且與 pandas 和 NumPy 等熱門 Python 庫兼容，因此在處理表格數據方面備受歡迎。現在，NVIDIA cuML 使您能夠繼續使用熟悉的 Scikit-learn API 和 Python 庫，同時使數據科學家和機器學習工程師能夠在 NVIDIA GPU 上利用 CUDA 的強大功能，而無需更改任何應用代碼。在 NVIDIA cuML 25.02 中，我們將在公測版中發布無需更改代碼即可加速 scikit-learn 算法的功能。2019 年首次推出的 NVIDIA cuML 已迅速為 Python 機器學習添加基于 CUDA 的 GPU 算法。借助最新版本，數據科學家和機器學習工程師能夠保持 scikit-learn 應用不變，并在 NVIDIA GPU 上實現比 CPU 快 50…

]]>

13333

隆重推出 NVIDIA Dynamo：用于擴展推理AI模型的低延遲分布式推理框架 http://www.open-lab.net/zh-cn/blog/introducing-nvidia-dynamo-a-low-latency-distributed-inference-framework-for-scaling-reasoning-ai-models/ Tue, 18 Mar 2025 05:47:45 +0000 http://www.open-lab.net/zh-cn/blog/?p=13330 Continued]]> NVIDIA 今天在 GTC 2025 宣布發布 NVIDIA Dynamo 。NVIDIA Dynamo 是一個高吞吐量、低延遲的開源推理服務框架，用于在大規模分布式環境中部署生成式 AI 和推理模型。在 NVIDIA Blackwell 上運行開源 DeepSeek-R1 模型時，該框架最多可將請求數量提升 30 倍。NVIDIA Dynamo 與 PyTorch、SGLang 等開源工具兼容， NVIDIA TensorRT-LLM 和 vLLM，加入不斷擴大的推理工具社區，助力開發者和 AI 研究人員加速 AI。 NVIDIA Dynamo 引入了幾項關鍵創新，包括：從今天開始，NVIDIA Dynamo 可供開發者在 ai-dynamo/dynamo GitHub 存儲庫中使用。對于希望縮短生產時間并獲得企業級安全性、支持和穩定性的企業，

]]>

13330

NVIDIA Blackwell 實現世界紀錄的 DeepSeek-R1 推理性能 http://www.open-lab.net/zh-cn/blog/nvidia-blackwell-delivers-world-record-deepseek-r1-inference-performance/ Tue, 18 Mar 2025 05:30:54 +0000 http://www.open-lab.net/zh-cn/blog/?p=13327 Continued]]> NVIDIA 在 NVIDIA GTC 2025 上宣布了創下世界紀錄的 DeepSeek-R1 推理性能。搭載 8 個 NVIDIA Blackwell GPU 的單個 NVIDIA DGX 系統，在具有 671 億個參數的先進大型 DeepSeek-R1 模型上，每個用戶每秒可實現超過 250 個 token，或每秒超過 30,000 個 token 的最大吞吐量。得益于 NVIDIA 開放生態系統的推理開發者工具的改進 (現已針對 NVIDIA Blackwell 架構進行優化) ，這些性能頻譜兩端的快速性能提升得以實現。隨著 NVIDIA 平臺不斷突破最新 NVIDIA Blackwell Ultra GPU 和 NVIDIA Blackwell GPU 的推理極限，這些性能記錄將會得到改善。單個 DGX B200 8-GPU 系統和單個 DGX…

]]>

13327

使用先進的開放式 NVIDIA Llama Nemotron 推理模型構建企業級 AI 智能體 http://www.open-lab.net/zh-cn/blog/build-enterprise-ai-agents-with-advanced-open-nvidia-llama-nemotron-reasoning-models/ Tue, 18 Mar 2025 05:22:03 +0000 http://www.open-lab.net/zh-cn/blog/?p=13323 Continued]]> 企業組織正在采用 AI 智能體來提高生產力并簡化運營。為了更大限度地發揮影響，這些智能體需要強大的推理能力來解決復雜的問題，發現隱藏的聯系，并在動態環境中自主做出邏輯決策。由于推理模型能夠解決復雜問題，因此已成為代理式 AI 生態系統的關鍵部分。通過使用長思考、Best-of-N 或自我驗證等技術，這些模型可以更好地處理代理式流程不可或缺的推理密集型任務。從自動化客戶支持到優化供應鏈和執行財務策略，推理模型正在為各種應用提供支持。在物流領域，它們通過模擬假設場景 (例如在中斷運輸期間改變貨運路線) 來提高效率。在科學研究中，它們有助于生成假設和多步驟解決問題。在醫療健康領域，它們增強了診斷和治療規劃。通過實現精確的邏輯推理，這些模型正在推動各行各業實現更可靠、更可擴展的 AI 解決方案。本文將介紹 NVIDIA Llama Nemotron 推理模型系列。

]]>

13323

使用 NVIDIA AgentIQ 開源工具包改進 AI 代碼生成 http://www.open-lab.net/zh-cn/blog/improve-ai-code-generation-using-nvidia-agentiq-open-source-toolkit/ Tue, 18 Mar 2025 05:17:03 +0000 http://www.open-lab.net/zh-cn/blog/?p=13320 Continued]]> 隨著 NVIDIA AgentIQ (用于連接和優化 AI 智能體團隊的開源庫) 的發布，開發者、專業人士和研究人員可以創建自己的代理式 AI 應用。本教程通過 AI 代碼生成示例，向您展示如何在 AgentIQ 中開發應用。我們將使用 LangGraph 和推理模型構建測試驅動的編碼代理，以擴展測試時計算。在預訓練、后訓練和推理中， Scaling laws 正在推動更智能的 AI 系統的發展。大語言模型 (LLMs) 的大規模預訓練提供了令人印象深刻的結果，但進一步擴展具有挑戰性。自主 AI 智能體和測試時計算方法 (例如 Deepseek-R1 使用的方法) 通過擴展后訓練和推理計算提供了顯著的改進。在為邏輯、數學或編碼等復雜任務構建 agentic 工作流時，這一點勢在必行。這些新穎的擴展方法更易于與 AgentIQ 結合使用，因為組織可以更好地設計、測試、

]]>

13320

人人超碰97caoporen国产