multinode – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 30 Mar 2023 06:37:07 +0000
zh-CN
hourly
1
196178272 -
使用 NVIDIA Nsight 系統加速數據中心和 HPC 性能分析
http://www.open-lab.net/zh-cn/blog/accelerating-data-center-and-hpc-performance-analysis-with-nvidia-nsight-systems/
Tue, 28 Mar 2023 06:33:07 +0000
http://www.open-lab.net/zh-cn/blog/?p=6618
Continued]]>
當 GPU 啟動線程、調度內核和從內存加載時, CPU 異步地向其提供數據、訪問網絡通信、管理系統資源等等。這只是運行應用程序所需的硬件活動的一小部分——由不同組件組成的管弦樂隊以完美的并行方式運行。作為一名開發人員,你是一個硬件管弦樂隊的指揮,旨在為最高性能進行協調。 NVIDIA Nsight 系統是一個系統范圍的評測工具,可以幫助調整您的硬件管弦樂隊。它使應用程序開發人員能夠調查相關性、依賴性、瓶頸和資源分配,以確保硬件組件協調工作。它在統一的時間線上可視化吞吐量和性能指標,自動檢測性能限制因素,并建議如何解決這些問題 對于根除單機效率低下的問題, Nsight 系統跟蹤是一種有效的方法。但這種工作流程是如何擴展的呢?多節點環境對現代計算工作負載至關重要。多節點評測是針對這些環境的一種分析技術,用于識別可能影響節點的瓶頸和其他性能問題,以及如何協調這些節點。
Source
]]>
6618
-
使用 NVIDIA cuQuantum 設備進行大規模最佳量子電路仿真
http://www.open-lab.net/zh-cn/blog/best-in-class-quantum-circuit-simulation-at-scale-with-nvidia-cuquantum-appliance/
Thu, 15 Dec 2022 06:55:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=5897
Continued]]>
政府、企業和學術界的量子算法研究人員有興趣在越來越大的量子系統上開發和測試新的量子算法。用例包括藥物發現、網絡安全、高能物理和風險建模。 然而,這些系統仍然很小,質量仍有待提高,容量有限。因此,在量子電路模擬器上開發應用程序和算法是很常見的。 NVIDIA cuQuantum 是一個軟件開發工具包( SDK ),使用戶能夠使用 GPU 輕松加速和縮放量子電路模擬。一種 計算狀態向量的自然工具 ,它使用戶能夠模擬比現在的量子計算機更深(更多的門)和更寬(更多的量子比特)的量子電路。 cuQuantum 包括最近發布的 NVIDIA cuQuantum Appliance ,這是一個具有多 GPU 、多節點狀態向量仿真支持的部署就緒軟件容器。 NVIDIA cuStateVec 中也提供了通用的多 GPU API ,可輕松集成到任何模擬器中。 對于張量網絡模擬,
Source
]]>
5897
-
用 NVIDIA DGX cuQuantum 設備實現超級計算規模的量子電路仿真
http://www.open-lab.net/zh-cn/blog/achieving-supercomputing-scale-quantum-circuit-simulation-with-the-dgx-cuquantum-appliance/
Thu, 22 Sep 2022 08:10:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=5186
Continued]]>
量子電路模擬對于開發量子計算機的應用程序和算法至關重要。由于已知量子計算算法和用例的破壞性,政府、企業和學術界的量子算法研究人員正在開發新的量子算法,并在更大的量子系統上進行基準測試。 在沒有大規模糾錯量子計算機的情況下,開發這些算法的最佳方法是通過量子電路模擬。量子電路模擬需要大量計算, GPU 是計算量子態的天然工具. 為了模擬更大的量子系統,有必要將計算分布在多個 GPU 和多個節點上,以充分利用超級計算機的計算能力。 NVIDIA cuQuantum 是一個軟件開發工具包( SDK ),使用戶可以使用 GPU 輕松加速和縮放量子電路模擬,為探索量子優勢提供了新的能力。 此 SDK 包括最近發布的 NVIDIA DGX cuQuantum Appliance ,這是一個支持部署的軟件容器,具有多 GPU 狀態向量模擬支持。通用多 GPU API 現在也可在…
Source
]]>
5186
-
多節點多 GPU :大規模使用 NVIDIA cuFFTMp FFT
http://www.open-lab.net/zh-cn/blog/multinode-multi-gpu-using-nvidia-cufftmp-ffts-at-scale/
Thu, 27 Jan 2022 05:41:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2965
Continued]]>
今天,NVIDIA 宣布發布 Early Access ( EA )的 cuFFTMp 。 cuFFTMp 是 cuFFT 的多節點、多進程擴展,使科學家和工程師能夠在 exascale 平臺上解決具有挑戰性的問題。 FFTs ( Fast Fourier Transforms )廣泛應用于分子動力學、信號處理、計算流體力學( CFD )、無線多媒體和機器學習等領域。有了 cuFFTMp , NVIDIA 現在不僅支持單個系統中的多個 GPU ,還支持跨多個節點的多個 GPU 。 圖 1 顯示, cuFFTMp 達到 1.8 PFlop / s 以上,超過該規模轉換峰值機器帶寬的 70% 。 在圖 2 中,問題大小保持不變,但 GPU 的數量從 8 增加到 2048 。可以看到, cuFFTMp 成功地擴展了問題,將單精度時間從 8 GPU ( 1 個節點)的…
Source
]]>
2965
人人超碰97caoporen国产