Gonzalo Brito – NVIDIA 技術ブログ http://www.open-lab.net/ja-jp/blog Wed, 11 Jan 2023 02:02:22 +0000 ja hourly 1 NVIDIA Grace Hopper Superchip アーキテクチャ徹底解説 http://www.open-lab.net/ja-jp/blog/nvidia-grace-hopper-superchip-architecture-in-depth/ Thu, 10 Nov 2022 02:25:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=1104 Reading Time: 6 minutes NVIDIA Grace Hopper Superchip アーキテクチャは、ハイパフォーマンス コンピューティング (HPC) と AI ワークロードのための、初の真のヘテロジニアス アクセラレーション プラットフォー … Continued]]> Reading Time: 6 minutes NVIDIA Grace Hopper Superchip アーキテクチャは、ハイパフォーマンス コンピューティング (HPC) と AI ワークロードのための、初の真のヘテロジニアス アクセラレーション プラットフォームです。GPU と CPU の両方の強みを活かしてアプリケーションを加速させるとともに、これまでで最もシンプルで生産性の高い分散型のヘテロジニアス プログラミング モデルを提供します。科學者やエンジニアは、世界で最も重要な問題の解決に集中することができます。 この記事では、Grace Hopper Superchip のすべてを學び、NVIDIA Grace Hopper が実現する畫期的な性能に注目します。NVIDIA Hopper H100 GPU を使用した最も強力な PCIe…

Source

]]>
1104
標準並列 C++ によるマルチ GPU プログラミング、パート 2 http://www.open-lab.net/ja-jp/blog/multi-gpu-programming-with-standard-parallel-c-part-2/ Mon, 18 Apr 2022 12:47:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=609 Reading Time: 3 minutes これは「標準並列プログラミング」シリーズの 3 回目の投稿です。このシリーズでは、標準言語による並列化をアクセラレーテッド コンピューティングで使用することの利點を取り上げています。 標準言語による並列処理を利用したコー … Continued]]> Reading Time: 3 minutes これは「標準並列プログラミング」シリーズの 3 回目の投稿です。このシリーズでは、標準言語による並列化をアクセラレーテッド コンピューティングで使用することの利點を取り上げています。 パート 1 では、次を説明しました。 この投稿では、引き続き ISO C++ アルゴリズムのパフォーマンスを最適化し、MPI を使用して複數の GPU にアプリケーションを拡張します。 自分のコードを CPU から GPU に移植するとき、パフォーマンスが専用 HPC コードより低くなると予想するのは當然かもしれません。結局のところ、ソフトウェア アーキテクチャの制約や、確立している API、ユーザー ベースから求められる高性能な追加機能を考慮する必要性によって、制限を受けます。それだけでなく、

Source

]]>
609
標準並列 C++ によるマルチ GPU プログラミング、パート 1 http://www.open-lab.net/ja-jp/blog/multi-gpu-programming-with-standard-parallel-c-part-1/ Mon, 18 Apr 2022 04:58:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=601 Reading Time: 3 minutes これは「標準並列プログラミング」シリーズの 2 回目の投稿です。このシリーズでは、標準言語による並列化をアクセラレーテッド コンピューティングで使用することの利點を取り上げています。 標準言語による並列処理を利用したコー … Continued]]> Reading Time: 3 minutes これは「標準並列プログラミング」シリーズの 2 回目の投稿です。このシリーズでは、標準言語による並列化をアクセラレーテッド コンピューティングで使用することの利點を取り上げています。 アプリケーションを GPU に移植することの難しさはケースバイケースです。最高のシナリオは、GPU で最適化された既存のライブラリを呼び出すことで、重要なコード セクションを高速化することです。たとえば、シミュレーション ソフトウェアの構成要素が BLAS の線形代數関數で構成されている場合、cuBLAS を利用して高速化することが可能です。 しかしながら、多くのコードでは、相當な量の手作業を回避できません。そのような場合は、特定のアクセラレータをターゲットにした CUDA のようなドメイン固有言語の使用を検討するでしょう。

Source

]]>
601
NVIDIA Hopper アーキテクチャの徹底解説 http://www.open-lab.net/ja-jp/blog/nvidia-hopper-architecture-in-depth/ Tue, 22 Mar 2022 08:39:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=150 Reading Time: 12 minutes 2022 年 3 月の NVIDIA GTC 基調講演において、NVIDIA の創業者/CEO であるジェンスン フアンが、新しい NVIDIA Hopper GPU アーキテクチャに基づく NVIDIA H100 Te … Continued]]> Reading Time: 12 minutes 2022 年 3 月の NVIDIA GTC 基調講演において、NVIDIA の創業者/CEO であるジェンスン フアンが、新しい NVIDIA Hopper GPU アーキテクチャに基づく NVIDIA H100 Tensor コア GPU を紹介しました。この記事では、新しい H100 GPU の內部と、NVIDIA Hopper アーキテクチャ GPU の重要な新機能について説明します。 NVIDIA H100 Tensor コア GPU は、大規模な AI や HPC において前世代の NVIDIA A100 Tensor コア GPU と比較して桁違いの性能の飛躍を実現するために設計された NVIDIA の第 9 世代データ センター GPU です。H100 は、

Source

]]>
150
人人超碰97caoporen国产