HPC SDK – NVIDIA 技術博客 http://www.open-lab.net/zh-cn/blog 閱讀開發者創建的最新技術信息、頭條新聞 和內容。 Thu, 12 Dec 2024 04:08:05 +0000 zh-CN hourly 1 196178272 用于直線 CUDA 圖形和其他性能增強的恒定時間啟動 http://www.open-lab.net/zh-cn/blog/constant-time-launch-for-straight-line-cuda-graphs-and-other-performance-enhancements/ Wed, 11 Sep 2024 08:11:14 +0000 http://www.open-lab.net/zh-cn/blog/?p=11288 Continued]]> CUDA Graphs 是一種將 GPU 運算定義為圖形(而非一系列流啟動)并將其批量處理的方法。CUDA Graph 將一組 CUDA 內核和其他 CUDA 運算分組在一起,并使用指定的依賴關系樹執行這些運算。它將與 CUDA 內核啟動和 CUDA API 調用相關的驅動程序活動結合起來,從而加快工作流程。它還可以執行與硬件加速的依賴關系,而不是在可能的情況下僅依賴 CUDA 流和事件。 CUDA 圖形對于 AI 框架尤為重要,因為它們使您能夠捕獲和回放一系列 CUDA 操作,從而降低 CPU 開銷并提高性能。借助最新的改進,您現在可以更好地利用 CUDA 圖形來加速 AI 工作負載。 在 CUDA 工具包 11.8 和 CUDA 工具包 12.6 以及隨附的驅動程序版本之間,NVIDIA 在幾個方面提高了 CUDA 圖形的性能: 在本文中,

Source

]]>
11288
使用 ISO C++語言并行在 GPU 上進行利潤和損失建模 http://www.open-lab.net/zh-cn/blog/profit-and-loss-modeling-on-gpus-with-iso-c-language-parallelism/ Wed, 07 Aug 2024 02:53:36 +0000 http://www.open-lab.net/zh-cn/blog/?p=10906 Continued]]> 上一篇文章“How to Accelerate Quantitative Finance with ISO C++ Standard Parallelism”(如何使用 ISO C++標準并行機制加速量化金融) 演示了如何使用 ISO C++標準并行機制和NVIDIA accelerated-quant-finance GitHub 庫中找到的代碼編寫 Black-Scholes 模擬。這種方法使您能夠高效地編寫簡潔且可移植的代碼。 僅使用標準 C++,就可以編寫可在現代多核 CPU 或 GPU 上并行運行的應用程序,而無需進行修改。本文從之前開發的 Black-Scholes 并行代碼開始,構建了一個更復雜的模型,并對其進行了優化,以利用 GPU 的優勢,同時保留標準 C++。 交易已實現波動性的熱門策略是對期權持倉進行增量套期保值。根據 Black-Scholes 的假設,

Source

]]>
10906
高效的 CUDA 調試:將 NVIDIA Compute Sanitizer 與 NVIDIA 工具擴展程序結合使用并創建自定義工具 http://www.open-lab.net/zh-cn/blog/efficient-cuda-debugging-using-compute-sanitizer-with-nvtx-and-creating-custom-tools/ Wed, 27 Mar 2024 08:04:12 +0000 http://www.open-lab.net/zh-cn/blog/?p=9450 Continued]]> NVIDIA Compute Sanitizer 是一款功能強大的工具,可以節省時間和精力,同時提高 CUDA 應用程序的可靠性和性能。在 CUDA 環境中調試代碼既具有挑戰性又耗時,尤其是在處理數千個線程時。Compute Sanitizer 可以提供幫助! 在這一系列的第一篇文章中,高效 CUDA 調試:使用 NVIDIA Compute Sanitizer 追蹤錯誤 中,我們將討論如何開始使用 Compute Sanitizer 工具,以檢查代碼中的內存泄漏和競爭條件。 在第二篇博文中,高效的 CUDA 調試:借助 NVIDIA Compute Sanitizer 實現內存初始化和線程同步。此外,我們還探討了用于檢查內存初始化和線程同步的工具。 在本文中,我們重點介紹了 Compute Sanitizer 的一些其他功能,即它與 NVIDIA 工具擴展程序 (NVTX)…

Source

]]>
9450
在加速計算時代構建高性能應用 http://www.open-lab.net/zh-cn/blog/building-high-performance-applications-in-the-era-of-accelerated-computing/ Mon, 25 Mar 2024 08:58:53 +0000 http://www.open-lab.net/zh-cn/blog/?p=9484 Continued]]> AI 正在通過新的數據處理、模擬和建模方法增強高性能計算 (HPC).由于這些新 AI 工作負載的計算需求,HPC 正在快速擴展。 為了使應用程序能夠擴展到多 GPU 和多節點平臺,HPC 工具和庫必須支持這種增長。 NVIDIA 提供加速 HPC 軟件解決方案的全面生態系統,幫助您的應用程序滿足現代 AI 驅動工作負載的需求。 除了問題修復和改進 HPC 編譯器的編譯時性能之外,HPC SDK 24.3 提供新功能,支持最新的 NVIDIA Grace Hopper 系統。 在使用 OpenMP Target Offload 指令進行 GPU 編程時,NVIDIA HPC 編譯器提供統一的內存編譯模式。這增加了對 OpenACC 中 Grace Hopper 和 HMM 系統統一內存的現有支持,以及 CUDA Fortran 和 標準并行度(stdpar) 編程模型,

Source

]]>
9484
NVIDIA HPC SDK v22.11 現已提供新的異步編程模型庫 http://www.open-lab.net/zh-cn/blog/new-asynchronous-programming-model-library-now-available-with-nvidia-hpc-sdk-v22-11/ Thu, 17 Nov 2022 11:06:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5803 Continued]]> 為慶祝 SuperComputing 2022 國際會議, NVIDIA 宣布發布 HPC 軟件開發工具包( SDK ) v22.11 。 NVIDIA 開發者計劃 的成員可以免費 下載 。 NVIDIA HPC SDK 是一套面向高性能計算( HPC )開發人員的編譯器、庫和工具。它提供了開發人員高效開發高性能應用程序所需的一切。 HPC SDK 及其組件每年都會進行多次更新,包括新功能、性能提升和其他增強。 除了通常的修復和增強之外,新的 v22.1 版本還為您提供了一個創新的庫的預覽,該庫旨在標準化 C ++異步。該庫使開發人員能夠編寫不特定于 CPU 或 GPU 機器的高級算法代碼,從而提高了程序員的生產力和應用程序的可移植性。 庫引入了異步調度工作的能力,這導致了比現有 C ++并行算法更好的資源利用率和性能。這實現了細粒度的執行控制、最小化延遲,

Source

]]>
5803
利用 AWS Graviton3 上的 SVE 加速 NVIDIA HPC 軟件 http://www.open-lab.net/zh-cn/blog/accelerating-nvidia-hpc-software-with-sve-on-aws-graviton3/ Mon, 19 Sep 2022 03:00:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=5248 Continued]]> 最新 NVIDIA HPC SDK 更新擴展了可移植性,現在支持基于 Arm 的 AWS Graviton 3 processor 。在本文中,您將學習如何使用 NVIDIA 編譯器啟用可縮放矢量擴展( Scalable Vector Extension , SVE )自動矢量化,以最大限度地提高運行在 AWS Graviton3 CPU 上的 HPC 應用程序的性能。 NVIDIA HPC SDK 包括經過驗證的編譯器、庫和軟件工具,對于最大限度地提高開發人員生產力和為 CPU 、 CPU 或云構建 HPC 應用 至關重要。 NVIDIA HPC compilers 為 NVIDIA GPU 和多核 Arm 、 OpenPOWER 或 x86-64 CPU 啟用跨平臺 C 、 C ++和 Fortran 編程。對于使用 OpenMP 、 OpenACC 和 CUDA 以 C…

Source

]]>
5248
通過全棧創新推動高性能計算 http://www.open-lab.net/zh-cn/blog/fueling-high-performance-computing-with-full-stack-innovation/ Wed, 01 Jun 2022 07:42:18 +0000 http://www.open-lab.net/zh-cn/blog/?p=4244 Continued]]> 高性能計算(HPC)已成為科學發現的基本工具。 無論是發現新的拯救生命的藥物,對抗氣候變化,還是創建精確的世界模擬,這些解決方案都需要巨大且快速增長的處理能力。它們越來越超出傳統計算方法的范圍。 這就是為什么業界接受 NVIDIA GPU加速計算的原因。與人工智能相結合,它為科學進步帶來了性能上百萬倍的飛躍。如今,2700個應用程序可以從 NVIDIA GPU 的加速中受益,而且這個數字在不斷增長的300萬開發者社區的支持下繼續上升。 要在整個 HPC 應用程序范圍內實現數倍的加速,需要在堆棧的各個級別進行不懈的創新。這從芯片和系統開始,一直到應用程序框架本身。 NVIDIA 平臺每年都在繼續提供顯著的性能改進,在體系結構和整個 NVIDIA 軟件堆棧方面都取得了不懈的進步。與六年前發布的 P100 相比, H100 Tensor Core GPU…

Source

]]>
4244
最新版本和資源:NVIDIA GTC 2022 http://www.open-lab.net/zh-cn/blog/latest-releases-and-resources-nvidia-gtc-2022/ Thu, 24 Mar 2022 07:07:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=3471 Continued]]> 我們每周的綜述包括最新的軟件更新、學習資源、活動和值得注意的新聞。本周我們有幾個軟件發布 軟件發布 NVIDIA HPC SDK 是一套完整的編譯器、庫和工具,用于開發加速的 HPC 應用程序。通過各種靈活的支持選項,用戶可以創建與他們的情況最相關的編程模型的應用程序。 HPC SDK 提供了多種編程模型,包括性能優化的插件庫、標準語言、基于指令的方法,以及 CUDA 提供的專門化。最近的許多改進都是在標準語言支持的領域中進行的,例如 ISO C ++、 ISO FORTRAN 和 Python 。 NVIDIA HPC 編譯器使用這些語言的公共規范的最新進展,提供了一種既可移植又可用于縮放 GPU 加速平臺的有生產力的編程環境。 請訪問我們的網站下載新的 HPCSDK 版本 22.3 ,并在“參考資料”部分閱讀我們關于使用標準語言進行并行編程的新帖子。

Source

]]>
3471
用標準語言并行性開發加速代碼 http://www.open-lab.net/zh-cn/blog/developing-accelerated-code-with-standard-language-parallelism/ Wed, 12 Jan 2022 05:03:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2768 Continued]]> NVIDIA 平臺是最成熟、最完整的加速計算平臺。在這篇文章中,我將介紹最簡單、最高效、最可移植的加速計算方法。有三種編程方法 GPU (圖 1 )。 CUDA C ++ Fortran 是 NVIDIA 可以展示新硬件和軟件創新的創新平臺,在這里,您可以調整應用程序以在 NVIDIA GPU 上實現最佳性能。許多開發人員認為這就是 NVIDIA 希望每個人為 GPU 編程的方式。 相反,我們預計,開發者首次來到NVIDIA 平臺將使用標準的并行編程語言,如 ISO C ++、 ISO Fortran 和 Python 。在這篇文章中,我強調了使用這種方法進行并行編程的一些成功,以證明進入NVIDIA CUDA 生態系統的最有成效的途徑。 NVIDIA 戰略的基礎是提供一套豐富、成熟的 SDK 和庫,在這些數據庫上可以構建應用程序。

Source

]]>
2768
使用 HPC SDK 21.11 (現已提供)最大限度地提高 HPC 應用程序的性能 http://www.open-lab.net/zh-cn/blog/maximize-performance-of-hpc-apps-with-hpc-sdk-21-11-available-now/ Mon, 13 Dec 2021 04:38:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2634 Continued]]> 在超級計算大會 (SC21) 上,NVIDIA 預先宣布了 HPC SDK 的下一次更新。今天,HPC SDK 21.11 版本發布給開發者計劃成員免費下載 高性能 NVIDIA SDK 是一套全面的編譯器和庫,用于高性能計算開發。它包括各種各樣的工具,這些工具被證明可以最大限度地提高開發人員的生產率,以及 HPC 應用程序的性能和可移植性。 HPC SDK 及其組件每年都會更新多次,包括新功能、性能提升和其他增強功能。 此 21.11 版本將包括對 HPC ++/ Fortran 編譯器支持和開發人員環境的更新,以及新的多節點多 GPU 庫功能。 …

Source

]]>
2634
使用 HPC SDK v21.11 最大限度地提高 HPC 應用程序的性能和可移植性 http://www.open-lab.net/zh-cn/blog/maximize-performance-and-portability-of-hpc-apps-with-hpc-sdk-v21-11/ Tue, 16 Nov 2021 06:52:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2377 Continued]]> 今天, NVIDIA 宣布了即將發布的 HPCSDK21 . 11 版本,其中包含新的庫增強功能。該軟件將在未來幾周內免費提供。 NVIDIA HPC SDK 是一套用于高性能計算開發的綜合編譯器和庫。它包括各種各樣的工具,這些工具被證明可以最大限度地提高開發人員的生產率,以及 HPC 應用程序的性能和可移植性。 HPC SDK 及其組件每年都會更新多次,包括新功能、性能提升和其他增強功能。 此 21 . 11 版本將包括對 HPC ++/ Fortran 編譯器支持和開發人員環境的更新,以及新的多節點 mulit GPU 庫功能。 NVFORTRAN 編譯器在去年的版本 20 . 11 中引入,它自動并行化使用 DO 并發標準語言功能編寫的代碼,如 此文章 中所述。 在 21 . 11 版中,程序員可以使用 ISO Fortran 標準當前工作草案中描述的…

Source

]]>
2377
利用英偉達 HPC 開發工具包開發下一代 HPC 應用程序 http://www.open-lab.net/zh-cn/blog/develop-the-next-generation-of-hpc-applications-with-the-nvidia-arm-hpc-developer-kit/ Mon, 15 Nov 2021 07:25:00 +0000 http://www.open-lab.net/zh-cn/blog/?p=2338 Continued]]> 2021 年 7 月, NVIDIA 宣布可使用 NVIDIA Arm HPC Developer Kit 和 NVIDIA HPC SDK 進行預訂購。從那時起, NVIDIA 及其合作伙伴一直在努力將設備交到開發人員手中,以提高全球可用性,并增強軟件堆棧。 英偉達 ARM HPC 開發套件基于千兆位 G242-P32 2U 服務器。它包括 ARM CPU 、兩個 A100 GPU 、兩個 NVIDIA BlueField – 2 數據處理器( DPU )和英偉達 HPC-SDK 套件工具。 這提供了對單節點和多節點配置的支持。可通過 GIGABYTE 訂購全球交付的裝置。 第一個處理器已經被應用于包括洛斯阿拉莫斯國家實驗室( LANL )、萊斯特大學、橡樹嶺國家實驗室( ORNL )和臺灣國家高性能計算中心( NCHC )的網站。他們成功地部署了多節點配置,

Source

]]>
2338
人人超碰97caoporen国产