Doris Pan – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Tue, 08 Feb 2022 05:50:58 +0000
zh-CN
hourly
1
196178272 -
多節點多 GPU :大規模使用 NVIDIA cuFFTMp FFT
http://www.open-lab.net/zh-cn/blog/multinode-multi-gpu-using-nvidia-cufftmp-ffts-at-scale/
Thu, 27 Jan 2022 05:41:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=2965
Continued]]>
今天,NVIDIA 宣布發布 Early Access ( EA )的 cuFFTMp 。 cuFFTMp 是 cuFFT 的多節點、多進程擴展,使科學家和工程師能夠在 exascale 平臺上解決具有挑戰性的問題。 FFTs ( Fast Fourier Transforms )廣泛應用于分子動力學、信號處理、計算流體力學( CFD )、無線多媒體和機器學習等領域。有了 cuFFTMp , NVIDIA 現在不僅支持單個系統中的多個 GPU ,還支持跨多個節點的多個 GPU 。 圖 1 顯示, cuFFTMp 達到 1.8 PFlop / s 以上,超過該規模轉換峰值機器帶寬的 70% 。 在圖 2 中,問題大小保持不變,但 GPU 的數量從 8 增加到 2048 。可以看到, cuFFTMp 成功地擴展了問題,將單精度時間從 8 GPU ( 1 個節點)的…
Source
]]>
2965
人人超碰97caoporen国产