cuTensorNet – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 14 Mar 2024 07:14:02 +0000
zh-CN
hourly
1
196178272 -
cuTENSOR 2.0:用于加速張量計算的全面指南
http://www.open-lab.net/zh-cn/blog/cutensor-2-0-a-comprehensive-guide-for-accelerating-tensor-computations/
Fri, 08 Mar 2024 07:08:27 +0000
http://www.open-lab.net/zh-cn/blog/?p=9225
Continued]]>
NVIDIA cuTENSOR 是一個 CUDA 數學庫,提供經過優化的張量運算。張量是一種密集的多維數組或數組片段。cuTENSOR 2.0 的發布代表著功能和性能方面的重大更新,這一版本重構了其 API,使其更富有表現力,包括在 NVIDIA Ampere 和 NVIDIA Hopper GPU 架構上實現的出色性能。 本文介紹了 cuTENSOR 2.0 庫,以及如何使用其運算。有關更多信息,請參閱系列中的下一篇文章 cuTENSOR 2.0:性能和應用. 雖然張量運算看起來很陌生,但它們描述了許多自然發生的算法。尤其是,這些運算在機器學習和量子化學中十分常見。 如果您已經使用 NVIDIA cuBLAS 或 BLAS,cuTENSOR 提供的三個例程可能會讓您感到眼前一亮: 主要區別在于,cuTENSOR 可將這些運算擴展到多維度 .
Source
]]>
9225
-
cuTENSOR 2.0:應用程序和性能
http://www.open-lab.net/zh-cn/blog/cutensor-2-0-applications-and-performance/
Fri, 08 Mar 2024 06:58:15 +0000
http://www.open-lab.net/zh-cn/blog/?p=9217
Continued]]>
雖然 第 1 部分 專注于使用全新的 NVIDIA cuTENSOR 2.0 CUDA 數學庫,但本文將介紹其他使用模式,特別是 Python 和 Julia 的使用。我們還將展示基于基準測試的 cuTENSOR 性能在多個應用領域中的表現。 本文探討了 cuTENSOR 2.0 的應用程序和性能基準測試。有關更多信息,請參閱系列的第一篇文章:cuTENSOR 2.0:用于加速張量計算的全面指南. 我們提供 Cutensor Python 軟件包,其中包含用于 Einsum 樣式的界面。該包利用 cuTENSOR,可以類似于 PyTorch 和 TensorFlow 的原生 einsum 實現。有關更多信息,請參閱 Installation 部分。 例如,cuTENSOR 可以作為 torch.einsum 使用,如下代碼示例所示:
Source
]]>
9217
-
借助 NVIDIA cuQuantum 23.10 加速量子電路模擬
http://www.open-lab.net/zh-cn/blog/accelerate-quantum-circuit-simulation-with-nvidia-cuquantum-23-10/
Mon, 18 Dec 2023 05:09:08 +0000
http://www.open-lab.net/zh-cn/blog/?p=8565
Continued]]>
NVIDIA cuQuantum 是一個用于加速量子計算工作流程的優化庫和工具集 SDK。借助 NVIDIA Tensor Core GPU,開發者可以利用它將基于狀態向量和張量網絡方法的量子電路模擬加速數個數量級。 cuQuantum 的目標是在 NVIDIA GPU 和 CPU 上以光速提供量子電路模擬。量子計算框架的用戶可以利用 cuQuantum 支持的模擬器為其工作負載實現 GPU 加速。 cuQuantum 23.10 對 NVIDIA cuTensorNet 和 NVIDIA cuStateVec 進行了更新。新功能包括對 NVIDIA Grace Hopper 系統的支持。欲了解更多信息,請參閱 cuQuantum 23.10 版本說明。 cuTensorNet 提供高級 API,便于量子模擬器開發者以直觀的方式進行編程,以充分利用其功能。
Source
]]>
8565
-
借助基礎 HPC 軟件發揮 NVIDIA Grace 和 NVIDIA Hopper 架構的強大功能
http://www.open-lab.net/zh-cn/blog/unlock-the-power-of-nvidia-grace-and-nvidia-hopper-architectures-with-foundational-hpc-software/
Thu, 16 Nov 2023 05:26:09 +0000
http://www.open-lab.net/zh-cn/blog/?p=8309
Continued]]>
高性能計算(HPC)為模擬和建模、醫療健康、生命科學、工業和工程等領域的應用提供支持。在現代數據中心,HPC 與 AI 協同工作,以變革性的新方式利用數據。 新一代 HPC 應用程序對性能和吞吐量的需求催生了一個能夠處理多種工作負載并在 CPU 和 GPU 之間實現緊密協作的加速計算平臺。NVIDIA Grace CPU 和 NVIDIA Hopper GPU 構成了用于 HPC 開發的行業領先硬件生態系統。 NVIDIA 提供了一系列工具、庫和編譯器,幫助開發者充分利用 NVIDIA Grace 和 NVIDIA Grace Hopper 架構的潛力。這些資源支持創新,并助力應用程序最大化地利用加速計算的優勢。此基礎軟件堆棧不僅提供了 GPU 加速的方法,還包括在基于 NVIDIA Grace 的系統上移植和優化應用程序的策略。
Source
]]>
8309
-
使用 NVIDIA cuQuantum 實現基于矩陣產品狀態的量子電路仿真
http://www.open-lab.net/zh-cn/blog/enabling-matrix-product-state-based-quantum-circuit-simulation-with-nvidia-cuquantum/
Mon, 06 Mar 2023 04:36:45 +0000
http://www.open-lab.net/zh-cn/blog/?p=6415
Continued]]>
量子電路模擬 是設計量子就緒算法的最佳方法,因此您可以在強大的量子計算機可用時立即利用它們。 NVIDIA cuQuantum 是一個 SDK ,它使您能夠利用不同的方式來執行量子電路模擬。 cuStateVec ,一個為狀態向量量子模擬器構建的高性能庫,依賴于在 GPU 存儲器中保存量子狀態向量。它的內存需求按 O ( 2 ^ N )進行縮放, N 表示量子位的數量。當你開始擴展到超過 40 個量子位時,這可能會非常昂貴。 為了減輕使用狀態向量方法的量子電路模擬的存儲器需求的指數縮放,可以使用張量網絡作為替代方案。你可以通過用增加的計算換取減少的空間來模擬更大的量子電路。 cuTensorNet 使您可以利用 NVIDIA GPU 上的張量網絡方法,與其他替代方案相比,提供了更高的可擴展性和更好的性能。盡管最近在加速張量收縮路徑發現方面取得了進展,
Source
]]>
6415
-
利用 NVIDIA cuTensorNet 進行量子電路模擬
http://www.open-lab.net/zh-cn/blog/scaling-quantum-circuit-simulation-with-cutensornet/
Wed, 02 Mar 2022 04:12:00 +0000
http://www.open-lab.net/zh-cn/blog/?p=3185
Continued]]>
量子計算渴望在更快的時間內為目前無法用經典計算解決的問題提供更強大的計算能力。 NVIDIA 最近發布了 cuQuantum SDK ,這是一個用于加速量子信息科學發展的高性能庫。 cuQuantum 最近被用于 打破在 DGX SuperPOD 上運行 MaxCut 量子算法模擬的世界紀錄 ,比以前的工作多了 8 倍的量子位。 cuQuantum 的初始目標應用程序是 量子電路模擬, 的加速,它由兩個主要庫組成: 在本文中,我們將對這兩個庫進行概述,并對 cuTensorNet 進行更詳細的討論。 cuQuantum SDK 中的 cuStateVec 庫通過針對模擬器中出現的大多數用例優化 GPU 內核,為基于狀態向量的模擬提供了高性能解決方案。雖然狀態向量法非常適合運行深度量子電路,但即使在當今最大的超級計算機上,也不可能對具有大量量子比特的量子電路進行模擬,
Source
]]>
3185
人人超碰97caoporen国产