CUDA – NVIDIA 技術ブログ
http://www.open-lab.net/ja-jp/blog
Tue, 03 Oct 2023 07:15:48 +0000
ja
hourly
1
-
NVIDIA CUDA Toolkit 12.2 がアプリケーションを強化する強力な機能をリリース
http://www.open-lab.net/ja-jp/blog/nvidia-cuda-toolkit-12-2-unleashes-powerful-features-for-boosting-applications/
Thu, 06 Jul 2023 06:13:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=2064
Reading Time: 2 minutes NVIDIA CUDA Toolkit 12.2 の最新リリースでは、さまざまな重要な新機能、プログラミング モデルの変更、そして CUDA アプリケーションを加速するハードウェア機能のサポート強化が取り入れられています … Continued]]>
Reading Time: 2 minutes NVIDIA CUDA Toolkit 12.2 の最新リリースでは、さまざまな重要な新機能、プログラミング モデルの変更、そして CUDA アプリケーションを加速するハードウェア機能のサポート強化が取り入れられています。 現在、NVIDIA から一般提供されている CUDA Toolkit 12.2 には、メジャーなものからマイナーなものまで、多くの新機能が含まれています。 この記事では、以下の主要機能の概要をご紹介します: NVIDIA は、アクセラレーテッド コンピューティングのパイオニアとして、世界で最も困難なコンピューティング課題の解決を支援するソリューションを創造しています。アクセラレーテッド コンピューティングには、チップ アーキテクチャ、システム、
Source
]]>
2064
-
GROMACS 2023 における CUDA Graphs のガイド
http://www.open-lab.net/ja-jp/blog/a-guide-to-cuda-graphs-in-gromacs-2023/
Fri, 14 Apr 2023 01:54:58 +0000
http://www.open-lab.net/ja-jp/blog/?p=1615
Reading Time: 4 minutes GPU は新しい世代になるごとに高速化され続けており、GPU 上の各アクティビティ (カーネルやメモリ コピーなど) が非常に速く完了することがよくあります。従來、各アクティビティは CPU が個別にスケジューリング ( … Continued]]>
Reading Time: 4 minutes GPU は新しい世代になるごとに高速化され続けており、GPU 上の各アクティビティ (カーネルやメモリ コピーなど) が非常に速く完了することがよくあります。従來、各アクティビティは CPU が個別にスケジューリング (起動) する必要があり、関連するオーバーヘッドが蓄積して性能のボトルネックになることがありました。CUDA Graphs 機能は、複數の GPU アクティビティを 1 つの計算グラフとしてスケジュールできるようにすることで、この問題に対処します。 この記事では、生體分子システムのシミュレーション パッケージであり、世界で最も利用されている科學ソフトウェア アプリケーションの 1 つである GROMACS で、CUDA Graphs がどのように最近では活用されているかをご説明します。
Source
]]>
1615
-
CUDA Toolkit 12.0 の一般提供が開始
http://www.open-lab.net/ja-jp/blog/cuda-toolkit-12-0-released-for-general-availability/
Mon, 12 Dec 2022 10:14:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=1218
Reading Time: 3 minutes NVIDIA は、CUDA Toolkit ソフトウェアの最新リリースである 12.0 を発表しました。このリリースは、數年ぶりのメジャー リリースで、新しいプログラミング モデルと新しいハードウェア機能による CUDA … Continued]]>
Reading Time: 3 minutes NVIDIA は、CUDA Toolkit ソフトウェアの最新リリースである 12.0 を発表しました。このリリースは、數年ぶりのメジャー リリースで、新しいプログラミング モデルと新しいハードウェア機能による CUDA アプリケーションの高速化に焦點を當てています。 詳細は、YouTube Premiere ウェビナー、CUDA 12.0: New Features and Beyond (CUDA 12.0: 新機能とその先) をご覧ください。 CUDA カスタム コード、拡張ライブラリ、および開発者ツールを使って、NVIDIA Hopper および NVIDIA Ada Lovelace アーキテクチャのアーキテクチャ固有の機能と命令を対象にアプリケーションをビルドできるようになりました。
Source
]]>
1218
-
NVIDIA Grace Hopper Superchip アーキテクチャ徹底解説
http://www.open-lab.net/ja-jp/blog/nvidia-grace-hopper-superchip-architecture-in-depth/
Thu, 10 Nov 2022 02:25:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=1104
Reading Time: 6 minutes NVIDIA Grace Hopper Superchip アーキテクチャは、ハイパフォーマンス コンピューティング (HPC) と AI ワークロードのための、初の真のヘテロジニアス アクセラレーション プラットフォー … Continued]]>
Reading Time: 6 minutes NVIDIA Grace Hopper Superchip アーキテクチャは、ハイパフォーマンス コンピューティング (HPC) と AI ワークロードのための、初の真のヘテロジニアス アクセラレーション プラットフォームです。GPU と CPU の両方の強みを活かしてアプリケーションを加速させるとともに、これまでで最もシンプルで生産性の高い分散型のヘテロジニアス プログラミング モデルを提供します。科學者やエンジニアは、世界で最も重要な問題の解決に集中することができます。 この記事では、Grace Hopper Superchip のすべてを學び、NVIDIA Grace Hopper が実現する畫期的な性能に注目します。NVIDIA Hopper H100 GPU を使用した最も強力な PCIe…
Source
]]>
1104
-
CUDA Toolkit 11.8 の新機能が公開
http://www.open-lab.net/ja-jp/blog/cuda-toolkit-11-8-new-features-revealed/
Tue, 04 Oct 2022 03:37:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=941
Reading Time: < 1 minute NVIDIA は、CUDA ツールキットの最新ソフトウェア リリース 11.8 を発表しました。このリリースは、新しいハードウェア機能によるプログラミング モデルの強化と CUDA アプリケーションのスピードアップに重點 … Continued]]>
Reading Time: < 1 minute NVIDIA は、CUDA ツールキットの最新ソフトウェア リリース 11.8 を発表しました。このリリースは、新しいハードウェア機能によるプログラミング モデルの強化と CUDA アプリケーションのスピードアップに重點を置いています。 NVIDIA Hopper および Ada Lovelace アーキテクチャ固有の新機能は、初めはライブラリとフレームワークの強化を通じて公開されます。NVIDIA Hopper アーキテクチャのための完全なプログラミング モデル強化は、CUDA Toolkit 12 ファミリからリリースされる予定です。 CUDA 11.8 はいくつかの重要な機能を備えています。この記事では、主要な機能の概要をご紹介します。 CUDA アプリケーションは、
Source
]]>
941
-
NVIDIA 數學ライブラリによる GPU アプリケーションの高速化
http://www.open-lab.net/ja-jp/blog/accelerating-gpu-applications-with-nvidia-math-libraries/
Tue, 26 Jul 2022 09:10:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=664
Reading Time: 3 minutes GPU アプリケーションを高速化する方法には、主にコンパイラ指示行、プログラミング言語、ライブラリの 3 つがあります。OpenACC などは指示行ベースのプログラミング モデルで、コードをスムーズに GPU に移植し、 … Continued]]>
Reading Time: 3 minutes GPU アプリケーションを高速化する方法には、主にコンパイラ指示行、プログラミング言語、ライブラリの 3 つがあります。OpenACC などは指示行ベースのプログラミング モデルで、コードをスムーズに GPU に移植し、高速化することができます。使い方は簡単ですが、特定のシナリオでは最適なパフォーマンスが得られない場合があります。 CUDA C や C++ などのプログラミング言語は、アプリケーションを高速化する際に、より大きな柔軟性を與えてくれます。しかし、最新のハードウェアで最適なパフォーマンスを実現するために、新しいハードウェア機能を活用したコードを書くことも、ユーザーの責任です。そこで、そのギャップを埋めるのが、ライブラリです。 コードの再利用性を高めるだけでなく、NVIDIA 數學ライブラリは、
Source
]]>
664
-
最新のリリースと関連情報: NVIDIA GTC 2022
http://www.open-lab.net/ja-jp/blog/latest-releases-and-resources-nvidia-gtc-2022/
Thu, 24 Mar 2022 10:55:00 +0000
http://www.open-lab.net/ja-jp/blog/?p=197
Reading Time: 2 minutes 最新のソフトウェア アップデート、教材、イベント、注目すべきニュースなどを毎週取り上げています。今週は、いくつかのソフトウェアのリリースがあります。 ソフトウェア リリース HPC SDK で標準言語を活用し、ポータブル … Continued]]>
Reading Time: 2 minutes 最新のソフトウェア アップデート、教材、イベント、注目すべきニュースなどを毎週取り上げています。今週は、いくつかのソフトウェアのリリースがあります。 ソフトウェア リリース NVIDIA HPC SDK は、高速化された HPC アプリケーションを開発するためのコンパイラ、ライブラリ、ツールの包括的なスイートです。幅広い柔軟なサポート オプションにより、ユーザーは自身の狀況に最も適したプログラミング モデルでアプリケーションを作成することができます。 HPC SDK は、パフォーマンスが最適化されたドロップイン ライブラリ、標準言語、ディレクティブベースのメソッド、CUDA が提供する特殊化など、さまざまなプログラミング モデルを提供しています。最新の機能強化の多くは、ISO C++、ISO Fortran、
Source
]]>
197
人人超碰97caoporen国产