Jeff Larkin – NVIDIA 技術ブログ http://www.open-lab.net/ja-jp/blog Thu, 21 Jul 2022 13:23:26 +0000 ja hourly 1 標準並列 C++ によるマルチ GPU プログラミング、パート 2 http://www.open-lab.net/ja-jp/blog/multi-gpu-programming-with-standard-parallel-c-part-2/ Mon, 18 Apr 2022 12:47:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=609 Reading Time: 3 minutes これは「標準並列プログラミング」シリーズの 3 回目の投稿です。このシリーズでは、標準言語による並列化をアクセラレーテッド コンピューティングで使用することの利點を取り上げています。 標準言語による並列処理を利用したコー … Continued]]> Reading Time: 3 minutes これは「標準並列プログラミング」シリーズの 3 回目の投稿です。このシリーズでは、標準言語による並列化をアクセラレーテッド コンピューティングで使用することの利點を取り上げています。 パート 1 では、次を説明しました。 この投稿では、引き続き ISO C++ アルゴリズムのパフォーマンスを最適化し、MPI を使用して複數の GPU にアプリケーションを拡張します。 自分のコードを CPU から GPU に移植するとき、パフォーマンスが専用 HPC コードより低くなると予想するのは當然かもしれません。結局のところ、ソフトウェア アーキテクチャの制約や、確立している API、ユーザー ベースから求められる高性能な追加機能を考慮する必要性によって、制限を受けます。それだけでなく、

Source

]]>
609
標準並列 C++ によるマルチ GPU プログラミング、パート 1 http://www.open-lab.net/ja-jp/blog/multi-gpu-programming-with-standard-parallel-c-part-1/ Mon, 18 Apr 2022 04:58:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=601 Reading Time: 3 minutes これは「標準並列プログラミング」シリーズの 2 回目の投稿です。このシリーズでは、標準言語による並列化をアクセラレーテッド コンピューティングで使用することの利點を取り上げています。 標準言語による並列処理を利用したコー … Continued]]> Reading Time: 3 minutes これは「標準並列プログラミング」シリーズの 2 回目の投稿です。このシリーズでは、標準言語による並列化をアクセラレーテッド コンピューティングで使用することの利點を取り上げています。 アプリケーションを GPU に移植することの難しさはケースバイケースです。最高のシナリオは、GPU で最適化された既存のライブラリを呼び出すことで、重要なコード セクションを高速化することです。たとえば、シミュレーション ソフトウェアの構成要素が BLAS の線形代數関數で構成されている場合、cuBLAS を利用して高速化することが可能です。 しかしながら、多くのコードでは、相當な量の手作業を回避できません。そのような場合は、特定のアクセラレータをターゲットにした CUDA のようなドメイン固有言語の使用を検討するでしょう。

Source

]]>
601
標準言語による並列処理を利用したコードの高速化 http://www.open-lab.net/ja-jp/blog/developing-accelerated-code-with-standard-language-parallelism/ Wed, 12 Jan 2022 08:52:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=26 Reading Time: 3 minutes NVIDIA プラットフォームは、アクセラレーテッド コンピューティングのための最も成熟した完全なプラットフォームです。この記事では、最もシンプルで生産性が高く、ポータブルなアクセラレーテッド コンピューティングへのアプ … Continued]]> Reading Time: 3 minutes NVIDIA プラットフォームは、アクセラレーテッド コンピューティングのための最も成熟した完全なプラットフォームです。この記事では、最もシンプルで生産性が高く、ポータブルなアクセラレーテッド コンピューティングへのアプローチを取り上げます。GPU プログラミングには、3 つのアプローチがあります (図 1)。 CUDA C++ および Fortran は、NVIDIA が新しいハードウェアおよびソフトウェアのイノベーションを公開し、開発者が NVIDIA GPU 上で可能な限り最高のパフォーマンスを実現するためにアプリケーションをチューニングすることができるイノベーションの基盤です。多くの開発者は、NVIDIA が GPU プログラミングをする全ての人に期待している方法がこれだと思っています。 しかし我々は、

Source

]]>
26
人人超碰97caoporen国产