GTC March 2024 – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Fri, 14 Feb 2025 05:34:13 +0000
zh-CN
hourly
1
196178272 -
借助 AI 驅動的細胞分析技術推進罕見疾病檢測
http://www.open-lab.net/zh-cn/blog/advancing-rare-disease-detection-with-ai-powered-cellular-profiling/
Wed, 29 Jan 2025 05:31:21 +0000
http://www.open-lab.net/zh-cn/blog/?p=12913
Continued]]>
由于傳統基因組測序的局限性,罕見疾病很難診斷。哥倫比亞大學助理教授 Wolfgang Pernice 正在使用 AI 驅動的細胞分析來彌合這些差距,并推動個性化醫療的發展。 在 NVIDIA GTC 2024 大會上,Pernice 分享了他的實驗室對 Charcot-Marie-Tooth (CMT) 和線粒體疾病等疾病的研究成果。他的團隊開發了 CellNet,這是一種 AI 驅動的系統,使用患者細胞的高分辨率圖像來識別與疾病相關的細微模式,從而實現準確診斷并制定新的治療策略。 基因組醫學一直致力于將診斷轉化為個性化的治療或治療方法。雖然取得了一些進展,但許多患有 7,000 種已知罕見遺傳病之一的患者仍然需要有效的治療方法。Pernice 的實驗室正在利用計算機視覺和深度學習來解決罕見疾病診斷和治療中的主要障礙,從而致力于更快速、更可擴展的基因組醫學方法。
Source
]]>
12913
-
利用 AI 驅動的洪水建模和 3D 可視化技術增強氣候韌性
http://www.open-lab.net/zh-cn/blog/strengthening-climate-resilience-with-ai-powered-flood-modeling-and-3d-visualizations/
Wed, 15 Jan 2025 06:43:24 +0000
http://www.open-lab.net/zh-cn/blog/?p=12706
Continued]]>
AI 驅動的洪水建模和 3D 可視化工具正在改變社區應對氣候風險的方式。在這場 NVIDIA GTC 2024 會議中,RSS-Hydro 的 Guy Schumann 和 Guillaume Gallion 將探索新一代地理空間應用和高保真可視化 (包括 NVIDIA Omniverse ) 如何通過為決策制定、公眾教育和救災人員訓練提供動態工具來增強抗災能力。 他們深入探討了 FloodSENS 等 AI 驅動的平臺如何結合使用衛星和傳感器數據以及在 NVIDIA GPUs 上運行的機器學習模型來創建高度準確的洪水地圖,即使在云量等具有挑戰性的條件下也是如此。 主要技術和方法包括: FloodSENS 平臺 FloodSENS 是一款由機器學習驅動的洪水繪圖工具,使用基于光學衛星數據訓練的 U-Net 模型。它通過集成數字高程模型 (DEM) 和水流量網格等輔助數據集,
Source
]]>
12706
-
深度學習模型提高遠程天氣和氣候預測的準確性
http://www.open-lab.net/zh-cn/blog/deep-learning-model-boosts-accuracy-in-long-range-weather-and-climate-forecasting/
Thu, 14 Nov 2024 07:10:24 +0000
http://www.open-lab.net/zh-cn/blog/?p=12035
Continued]]>
華盛頓大學大氣科學系教授 Dale Durran 介紹了一種突破性的深度學習模型,該模型結合了大氣和海洋數據來設定新的氣候和天氣預報準確性標準。 在此 NVIDIA GTC 2024 會議中,Durran 介紹了一些技術,這些技術可以減少對傳統參數化的依賴,使模型能夠繞過天氣預報中常見的許多近似值。HEALPix 網格(從天文學中借鑒的網格)通過準確呈現地球的球形形狀來提高空間精度,消除失真,從而實現更精確的全球預報。 該模型能夠以最小的漂移生成可靠的長期預測,使用 NVIDIA A100 Tensor Core GPU 進行快速訓練,使用 NVIDIA PhysicsNeMo 在模擬中集成機器學習,并使用 NVIDIA Omniverse 實現高保真可視化,從而提高氣候預測的準確性和可解釋性。 您將學習構建準確、長期的地球系統模型的高級方法,包括:
Source
]]>
12035
-
機器人家務技能培訓
http://www.open-lab.net/zh-cn/blog/teaching-robots-to-tackle-household-chores/
Wed, 30 Oct 2024 09:51:31 +0000
http://www.open-lab.net/zh-cn/blog/?p=11852
Continued]]>
機器人可以承擔重復性或耗時的任務,從而使日常生活變得更加輕松。在 2024 年的 NVIDIA GTC 大會上,斯坦福大學的研究人員推出了 BEHAVIOR-1K,這是一項主要基準測試,旨在訓練機器人執行 1,000 項真實世界的活動,例如折疊衣物、烹飪早餐和清理派對后的場地。 OmniGibson 是一個先進的模擬環境,用于加速基于 NVIDIA Omniverse 平臺的具體 AI 研究。借助 OmniGibson,他們專注于訓練機器人掌握可直接應用于現實環境(從家庭輔助到工作場所等)的實用技能。 作為讓機器人技術用于日常輔助這一更廣泛計劃的一部分,BEHAVIOR-1K 基準測試側重于將先進的機器人功能帶入現實,并讓人們有時間參與他們喜歡的活動。 請關注 會議的 PDF 格式 ,其中詳細介紹了 BEHAVIOR-1K 如何利用從涉及 1,400…
Source
]]>
11852
-
利用 CUDA 圖形、Coroutines 和 GPU 工作流程加速藥物發現進程
http://www.open-lab.net/zh-cn/blog/optimizing-drug-discovery-with-cuda-graphs-coroutines-and-gpu-workflows/
Wed, 23 Oct 2024 05:28:03 +0000
http://www.open-lab.net/zh-cn/blog/?p=11700
Continued]]>
藥物研究需要快速、高效的模擬來預測分子如何相互作用,從而加速藥物研發。NVIDIA 高級開發者技術工程師 Jiqun Tu 和 Schrödinger Desmond 引擎技術負責人 Ellery Russell 將探索旨在加速分子動力學模擬的高級 GPU 優化技術。 在這場 NVIDIA GTC 2024 會議中,他們提出了提高工作負載效率和吞吐量的實用策略,為藥物研究人員提供了增強計算藥物研發的工具。這些策略基于現有的 CUDA 工作流,涵蓋了 CUDA Graphs、C++ coroutines 和 mapped memory 等創新技術,可克服擴展挑戰和瓶頸。 請關注我們,并獲取 會議的 PDF 文件 ,該文件為與會者提供切實可行的技術,以優化性能、最大限度地降低延遲,并充分利用 GPU 功能進行分子模擬。主題包括: CUDA 圖形:
Source
]]>
11700
-
借助 NVIDIA CUDA 實現高性能 GPU 編程的高級策略
http://www.open-lab.net/zh-cn/blog/advanced-strategies-for-high-performance-gpu-programming-with-nvidia-cuda/
Wed, 11 Sep 2024 08:08:06 +0000
http://www.open-lab.net/zh-cn/blog/?p=11284
Continued]]>
Stephen Jones 是杰出的專家,也是杰出的 NVIDIA CUDA 架構師。他提供指導和見解,深入探討將應用程序映射到大規模并行機器的復雜性。除了探索 GPU 編程復雜性的基礎知識之外,他還專注于實用技術,例如并行程序設計和 GPU 優化的具體細節,以提高應用程序的效率和性能。 作為正在進行的系列講座的一部分,本會議基于之前的講座。雖然不要求您看過之前的講座,但您可以探索 GPU 計算的工作原理、CUDA 編程的工作原理以及如何編寫 CUDA 程序等基礎主題。 無論您是剛接觸 CUDA,還是希望提高 GPU 編程技能,本課程都會提供在高性能計算方面取得出色表現所需的理論知識和可行策略。 歡迎閱讀會議的 PDF 格式,您將掌握編寫高效 CUDA 程序所需的高級技能和見解,從而充分發揮您的 GPU 的效用。您將深入了解:
Source
]]>
11284
-
LLM 推理規模和性能優化的實踐策略
http://www.open-lab.net/zh-cn/blog/practical-strategies-for-optimizing-llm-inference-sizing-and-performance/
Wed, 21 Aug 2024 07:43:33 +0000
http://www.open-lab.net/zh-cn/blog/?p=11025
Continued]]>
隨著聊天機器人和內容創建等許多應用越來越多地使用大型語言模型(LLM),了解擴展和優化推理系統的過程非常重要,以便就 LLM 推理的硬件和資源做出明智的決策。 在接下來的一場演講中,NVIDIA 的高級深度學習解決方案架構師Dmitry Mironov 和 Sergio Perez 將指導您了解 LLM 推理規模的關鍵方面。他們分享了他們的專業知識、最佳實踐和技巧,并將指導您如何高效地處理部署和優化 LLM 推理項目的復雜性。 請閱讀會議的 PDF,同時了解如何通過了解 LLM 推理規模中的關鍵指標為您的 AI 項目選擇正確的路徑。探索如何準確確定硬件和資源的規模、優化性能和成本,以及選擇最佳的部署策略,不論是在本地還是在云端。 您還將介紹NVIDIA NeMo推理規模計算器(使用此NIM進行LLM基準測試指南復制)和NVIDIA Triton性能分析器等高級工具,
Source
]]>
11025
-
NVIDIA GTC 2024 的頂級數據科學會議現已按需提供
http://www.open-lab.net/zh-cn/blog/top-data-science-sessions-from-nvidia-gtc-2024-now-available-on-demand/
Mon, 29 Apr 2024 08:55:05 +0000
http://www.open-lab.net/zh-cn/blog/?p=9899
Continued]]>
在 GTC 2024 上, NVIDIA 的專家和我們的合作伙伴分享了有關 GPU 加速工具、優化和數據科學家最佳實踐的見解。從涵蓋各種主題的數百場會議中,我們精心挑選了您不想錯過的前三場數據科學會議。 RAPIDS 2024:無處不在的數據科學加速 演講嘉賓: Dante Gama Dessavre,NVIDIA 機器學習工程經理: Nick Becker,NVIDIA 高級技術產品經理 在這次演示中,我們的團隊宣布 RAPID 現在允許數據科學家可以訪問 GPU 加速,同時仍然可以使用您喜歡的工具進行數據幀、機器學習、圖形分析、矢量數據庫,甚至基于 LLM 的工作流。該團隊還介紹了如何利用加速計算的令人興奮的更新,以及 2024 年的 RAPID 路線圖。 零代碼加速熊貓:使用 RAPIDS cuDF 實現高速更改 主講人:Ashwin Srinath,
Source
]]>
9899
-
借助 NVIDIA NeMo 定制器輕松微調和對齊 LLM
http://www.open-lab.net/zh-cn/blog/fine-tune-and-align-llms-easily-with-nvidia-nemo-customizer/
Wed, 27 Mar 2024 08:27:24 +0000
http://www.open-lab.net/zh-cn/blog/?p=9466
Continued]]>
隨著 大型語言模型(LLM) 在企業 AI 應用中獲得更多吸引力,定制化模型 理解和集成特定行業術語、領域專業知識和獨特的組織要求變得越來越重要。 為滿足對自定義 LLM 的日益增長的需求,NVIDIA NeMo 團隊宣布 NeMo Customizer 搶先體驗計劃。這是一種高性能、可擴展的微服務,可簡化 LLM 的微調和對齊。 企業可以利用 NVIDIA NeMo 來開發自定制的生成式 AI 平臺,包括訓練、微調、檢索增強生成 (RAG)、guardrailing 和數據管護等功能。NeMo 提供從框架到更高級別的 API 端點,以簡化開發過程。它提供了預訓練模型和技術堆棧,以幫助企業快速開發和部署具有特定功能的生成式 AI 模型。 NeMo Customizer 微服務是一組基于 NeMo 框架的 API 端點,旨在為企業提供快速、
Source
]]>
9466
-
重新思考如何訓練 Diffusion 模型
http://www.open-lab.net/zh-cn/blog/rethinking-how-to-train-diffusion-models/
Thu, 21 Mar 2024 09:46:57 +0000
http://www.open-lab.net/zh-cn/blog/?p=9503
Continued]]>
在探索了擴散模型采樣、參數化和訓練的基礎知識之后,我們的團隊開始研究這些網絡架構的內部結構。請參考 生成式 AI 研究聚焦:揭開基于擴散的模型的神秘面紗 了解更多詳情。 結果證明這是一項令人沮喪的練習。任何直接改進這些模型的嘗試都會使結果更加糟糕。它們似乎處于微妙、微調、高性能的狀態,任何更改都會破壞平衡。雖然通過徹底重新調整超參數可以實現好處,但下一組改進將需要重新經歷整個過程。 如果您熟悉這種繁瑣的開發循環,但您不直接使用擴散,請繼續閱讀。我們的研究結果針對大多數神經網絡及其訓練背后的普遍問題和組件。 我們決定打破這個循環,回顧一下基礎知識。為什么架構如此易碎?網絡中是否存在破壞訓練進程的未知現象?我們如何使其更加穩健?歸根結底:由于這些問題,我們目前還剩下多少性能? 我們最近的論文 分析和改進擴散模型的訓練動力學 中報告了我們的研究結果和細節。
Source
]]>
9503
-
升級顯卡:探索 NVIDIA Nsight 工具的全新光線追蹤功能
http://www.open-lab.net/zh-cn/blog/upgrade-your-graphics-explore-new-ray-tracing-features-for-nvidia-nsight-tools/
Thu, 21 Mar 2024 09:35:25 +0000
http://www.open-lab.net/zh-cn/blog/?p=9497
Continued]]>
光線追蹤和 AI 的結合正在將圖形保真度和性能提升到新的高度。幫助您在渲染技術時代構建優化的、無錯誤的應用程序,最新版本的 NVIDIA Nsight Graphics 引入光線追蹤開發的新功能,包括利用 AI 加速的工具。 查看 NVIDIA Nsight Graphics 2024.1 版本視頻中的新增功能。 在 Nsight Graphics Pro 中提供,Vulkan Shader Debugger 引入了一套強大的工具,用于檢查和調試著色器。 這使您能夠實時調試長達數百或數千行的復雜著色器。它完全在 GPU 上運行,您的應用程序在您深入了解著色器代碼的同時實時執行。圖形以全速運行,直到達到指定的斷點,因此導航到調試位置時不會影響性能,并且在調試時盡可能減少開銷。 調試工作流程與傳統 IDE 類似。您可以逐步執行代碼并檢查運行中的著色器狀態和變量。
Source
]]>
9497
-
加速 AI 開發: NVIDIA AI Workbench 正式發布
http://www.open-lab.net/zh-cn/blog/speed-up-your-ai-development-nvidia-ai-workbench-goes-ga/
Thu, 21 Mar 2024 09:21:41 +0000
http://www.open-lab.net/zh-cn/blog/?p=9491
Continued]]>
NVIDIA AI Workbench 是面向 AI 和 ML 開發者的工具包。現在已正式推出 免費下載。它具有自動化功能,可為新手開發者消除障礙,并提高專家的工作效率。 無論技能水平如何,開發者都可以體驗快速可靠的 GPU 環境設置,以及跨異構平臺工作、管理和協作的自由。購買 NVIDIA AI Enterprise 許可證的客戶還可以獲得企業級支持。 AI 工作臺的主要功能包括: 自測試版發布以來,AI Workbench 還具有幾個新的關鍵功能: 生成式 AI 已呈爆炸式增長。AI Workbench 可以在數以億計的現代 NVIDIA RTX 驅動的工作站和 PC 上,或在數據中心和云中使用統一接口,將生成式 AI 開發引入任何 GPU 支持的環境。Mac 用戶可以安裝 AI Workbench,并將項目遷移到 NVIDIA 驅動的系統中,
Source
]]>
9491
-
借助 NVIDIA 6G 開發者計劃加速無線通信的未來
http://www.open-lab.net/zh-cn/blog/accelerating-future-of-wireless-communication-with-nvidia-6g-developer-program/
Wed, 20 Mar 2024 05:52:32 +0000
http://www.open-lab.net/zh-cn/blog/?p=9338
Continued]]>
6G 將首次實現電信網絡 AI 原生。為了開發 6G 技術,電信行業需要一種全新的研究方法。 隨著 6G 技術的出現,無線通信領域正處于重大變革的邊緣。6G 是即將推出的第六代無線網絡,有望提供超高性能的互連,即使在多樣化的移動性、超高密度和動態環境等嚴苛場景下也是如此。 6G 的主要驅動應用包括交付全球規模的生成式 AI 應用、智慧城市、智能工廠、無人駕駛飛行器、沉浸式通信服務和多維感知服務。 為了加速 6G 技術的發展,NVIDIA 推出了 NVIDIA 6G 開發者計劃。該計劃旨在普及對 AI/ML 工具、射頻模擬環境、加速計算基礎設施和全套軟件定義的端到端網絡功能的訪問。其目標是使 6G 無線研究人員能夠在新的水平上進行前沿研究,以便在 6G 的關鍵領域獲得早期的想法。 NVIDIA 6G 開發者計劃包括一個名為 NVIDIA Aerial Omniverse…
Source
]]>
9338
-
突破性的 NVIDIA cuOpt 算法將路線優化解決方案的速度提高 100 倍
http://www.open-lab.net/zh-cn/blog/record-breaking-nvidia-cuopt-algorithms-deliver-route-optimization-solutions-100x-faster/
Wed, 20 Mar 2024 05:44:33 +0000
http://www.open-lab.net/zh-cn/blog/?p=9332
Continued]]>
NVIDIA cuOpt 是一個加速優化引擎,專為解決復雜的路線規劃問題而設計。它能夠高效地處理各種問題,包括但不限于:休息和等待時間、車輛的多個成本和時間矩陣、多目標優化、訂單與車輛的匹配、車輛的起始和結束位置、以及車輛的起始和結束時間等。 更具體地說,cuOpt 解決了兩個問題的多個變體:時間窗口容量車輛路線規劃問題 (CVRPTW) 和時間窗口拾貨和交付問題 (PDPTW).這些問題的目的是滿足客戶請求,同時盡可能減少車輛數量和按相應順序行駛的總距離。 cuOpt 在過去三年中設定的最大路由基準測試中打破了 23 項世界紀錄,由 SINTEF 進行。 本文將探討優化算法的關鍵要素及其定義,以及將 NVIDIA cuOpt 與該領域的領先解決方案進行基準測試的過程,并重點介紹這些比較的重要性。在整篇博文中,我們將術語“請求”用于 CVRPTW 的訂單,
Source
]]>
9332
-
使用 NVIDIA Holoscan 1.0 開發生產就緒型 AI 傳感器處理應用
http://www.open-lab.net/zh-cn/blog/developing-production-ready-ai-sensor-processing-applications-with-nvidia-holoscan-1-0/
Wed, 20 Mar 2024 05:01:33 +0000
http://www.open-lab.net/zh-cn/blog/?p=9327
Continued]]>
邊緣 AI 開發者正在為安全關鍵型和受監管用例構建 AI 應用和產品。借助 NVIDIA Holoscan 1.0,這些應用可以在幾毫秒內整合實時見解和處理功能。 借助近期發布的 NVIDIA Holoscan 1.0,開發者可以更輕松地構建用于多模態實時傳感器處理的生產就緒型應用程序。NVIDIA AI Enterprise 現在可為 Holoscan 軟件堆棧提供安全補丁和關鍵錯誤修復,并具有有保證的 API 穩定性。這降低了產品維護成本,并簡化了邊緣 AI 應用程序的大規模部署。 Holoscan 是一個與領域無關的 NVIDIA 多模態實時 AI 傳感器處理平臺,為開發者構建端到端傳感器處理流程奠定了基礎。該平臺以性能、可用性和生產就緒型等架構目標為基礎而構建。在傳感器處理流程的每個步驟中,Holoscan 都能提供優化的性能,同時更大限度地降低開發復雜性。該流程包括:
Source
]]>
9327
人人超碰97caoporen国产