Parallel Programming – NVIDIA 技術ブログ

NVIDIA HPC SDK v22.11 で新しい非同期プログラミングモデルライブラリが利用可能に

Thu, 17 Nov 2022 01:30:00 +0000

Reading Time: < 1 minute SuperComputing 2022 の國際會議開催に合わせて、NVIDIA は HPC Software Development Kit (SDK) v22.11 のリリースを発表しました。NVIDIA Developer プログラムに登録したメンバーは、このリリースを今すぐ無料でダウンロードすることができます。 NVIDIA HPC SDK は、ハイパフォーマンスコンピューティング (HPC) 開発者向けのコンパイラ、ライブラリ、ツールの包括的なスイートです。開発者が高性能アプリケーションを生産的に開発するために必要なもの全てを提供します。HPC SDK とそのコンポーネントは、新機能、性能の向上、その他の強化のために、毎年何度も更新されています。通常の修正と機能強化に加え、新しい v22.11…

Source

]]>

QODA の紹介: 量子古典ハイブリッドコンピューティングのためのプラットフォーム

Thu, 14 Jul 2022 08:10:00 +0000

Reading Time: 2 minutes この 10 年間で、量子コンピューティングはアカデミックな研究室から主流に躍り出ました。より優れた量子コンピューターを構築するための取り組みが、スタートアップや大企業の両方で盛んに行われています。一般的な問題に量子の利點を利用できるようになるまでの道のりはまだ明確ではありませんが、今こそ価値ある量子アプリケーションを実現するために必要なツールを構築する時であることは明らかです。その手始めとして、量子アルゴリズムに対する理解を深める必要があります。昨年、NVIDIA は量子コンピューティングのシミュレーションを高速化するためのソフトウェア開発キット (SDK) である cuQuantum を発表しました。GPU 上で cuQuantum を使用して量子回路をシミュレーションすることにより、

Source

]]>

標準並列 C++ によるマルチ GPU プログラミング、パート 2

Mon, 18 Apr 2022 12:47:00 +0000

Reading Time: 3 minutes これは「標準並列プログラミング」シリーズの 3 回目の投稿です。このシリーズでは、標準言語による並列化をアクセラレーテッドコンピューティングで使用することの利點を取り上げています。パート 1 では、次を説明しました。この投稿では、引き続き ISO C++ アルゴリズムのパフォーマンスを最適化し、MPI を使用して複數の GPU にアプリケーションを拡張します。自分のコードを CPU から GPU に移植するとき、パフォーマンスが専用 HPC コードより低くなると予想するのは當然かもしれません。結局のところ、ソフトウェアアーキテクチャの制約や、確立している API、ユーザーベースから求められる高性能な追加機能を考慮する必要性によって、制限を受けます。それだけでなく、

Source

]]>

標準並列 C++ によるマルチ GPU プログラミング、パート 1

Mon, 18 Apr 2022 04:58:00 +0000

Reading Time: 3 minutes これは「標準並列プログラミング」シリーズの 2 回目の投稿です。このシリーズでは、標準言語による並列化をアクセラレーテッドコンピューティングで使用することの利點を取り上げています。アプリケーションを GPU に移植することの難しさはケースバイケースです。最高のシナリオは、GPU で最適化された既存のライブラリを呼び出すことで、重要なコードセクションを高速化することです。たとえば、シミュレーションソフトウェアの構成要素が BLAS の線形代數関數で構成されている場合、cuBLAS を利用して高速化することが可能です。しかしながら、多くのコードでは、相當な量の手作業を回避できません。そのような場合は、特定のアクセラレータをターゲットにした CUDA のようなドメイン固有言語の使用を検討するでしょう。

Source

]]>

CUDA 11.6 ツールキットの新リリースを発表

Mon, 17 Jan 2022 06:04:00 +0000

Reading Time: < 1 minute NVIDIA は、 CUDA 開発環境の最新リリースである CUDA 11.6 を発表しました。今回のリリースは、プログラミングモデルとアプリケーションのパフォーマンスの向上に焦點を當てています。 CUDA は、 GPU アクセラレーションの限界を押し広げ、HPC、ビジュアライゼーション、AI、ML と DL、データサイエンスにおける新しいアプリケーションの基礎を築き続けます。 CUDA 11.6 にはいくつかの重要な機能があります。この記事では、主な機能の概要をご紹介します。 CUDA 11.6 にはアップデートブランチである R510 ドライバーが同梱されています。 CUDA 11.6 ツールキットこちらからダウンロード可能です。 GSP ドライバーアーキテクチャは、

Source

]]>

標準言語による並列処理を利用したコードの高速化

Wed, 12 Jan 2022 08:52:00 +0000

Reading Time: 3 minutes NVIDIA プラットフォームは、アクセラレーテッドコンピューティングのための最も成熟した完全なプラットフォームです。この記事では、最もシンプルで生産性が高く、ポータブルなアクセラレーテッドコンピューティングへのアプローチを取り上げます。GPU プログラミングには、3 つのアプローチがあります (図 1)。 CUDA C++ および Fortran は、NVIDIA が新しいハードウェアおよびソフトウェアのイノベーションを公開し、開発者が NVIDIA GPU 上で可能な限り最高のパフォーマンスを実現するためにアプリケーションをチューニングすることができるイノベーションの基盤です。多くの開発者は、NVIDIA が GPU プログラミングをする全ての人に期待している方法がこれだと思っています。しかし我々は、

Source

]]>

Parallel Programming – NVIDIA 技術ブログ

NVIDIA HPC SDK v22.11 で新しい非同期プログラミング モデル ライブラリが利用可能に

QODA の紹介: 量子古典ハイブリッド コンピューティングのためのプラットフォーム

標準並列 C++ によるマルチ GPU プログラミング、パート 2

標準並列 C++ によるマルチ GPU プログラミング、パート 1

CUDA 11.6 ツールキットの新リリースを発表

標準言語による並列処理を利用したコードの高速化

NVIDIA HPC SDK v22.11 で新しい非同期プログラミングモデルライブラリが利用可能に

QODA の紹介: 量子古典ハイブリッドコンピューティングのためのプラットフォーム