Anton Anders – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Fri, 28 Feb 2025 08:54:35 +0000 zh-CN hourly 1 196178272 NVIDIA cuDSS 提高工程和科學計算中的求解器技術 http://www.open-lab.net/zh-cn/blog/nvidia-cudss-advances-solver-technologies-for-engineering-and-scientific-computing/ Tue, 25 Feb 2025 08:54:08 +0000 http://www.open-lab.net/zh-cn/blog/?p=13042 Continued]]> NVIDIA cuDSS 是第一代稀疏直接求解器庫,旨在加速工程和科學計算。cuDSS 正越來越多地應用于數據中心和其他環境,并支持單 GPU、多 GPU 和多節點(MGMN)配置。 cuDSS 已成為加速多個領域 (例如結構工程、流體動力學、電磁學、電路模擬、優化和 AI 輔助工程問題) 的計算機輔助工程 (CAE) 工作流程和科學計算的關鍵工具。 本文重點介紹了 cuDSS v0.4.0 和 cuDSS v0.5.0 中提供的一些關鍵性能和可用性功能 (如表 1 中總結的內容),cuDSS v0.4.0 可顯著提升分解和求解步驟的性能,同時還引入了一些新功能,包括內存預測 API、自動混合內存選擇和可變批量支持。cuDSS v0.5.0 增加了主機執行模式,這對較小的矩陣特別有利,并且在分析階段使用混合內存模式和主機多線程實現了顯著的性能提升,

Source

]]>
13042
聚焦:Honeywell 借助 NVIDIA cuDSS 加速工業流程仿真 http://www.open-lab.net/zh-cn/blog/spotlight-honeywell-accelerates-industrial-process-simulation-with-nvidia-cudss/ Tue, 05 Mar 2024 06:43:16 +0000 http://www.open-lab.net/zh-cn/blog/?p=9136 Continued]]> 多年來,傳統的工業流程建模和仿真方法一直在努力充分利用多核 CPU 或加速設備以并行運行模擬和優化計算。使用在流程建模和仿真中的多核線性求解器沒有達到預期的改進,在某些情況下甚至表現不如優化的單核求解器。 NVIDIA cuDSS 是一個優化后的第一代 GPU 加速直接稀疏求解器庫,用于解決具有非常稀疏矩陣的線性系統。它使用 CUDA 在 GPU 上并行求解矩陣分解和解,并集成到 Honeywell UniSim 設計 稱為 UniSim EO。 Honeywell 擁有一組由 UniSim EO 流程模型應用生成的非對稱矩陣。該組包括上游和中游石油和天然氣、煉油、精細化工和化學工藝單元的模型。Honeywell 的內部稀疏線性方程求解器 DOTAXB 用作與 cuDSS 的比較基礎。計算平臺是由 Microsoft Azure 實例提供支持的 NVIDIA A100 Tensor…

Source

]]>
9136
人人超碰97caoporen国产