Fred Oh – NVIDIA 技術ブログ http://www.open-lab.net/ja-jp/blog Wed, 20 Dec 2023 03:14:09 +0000 ja hourly 1 NVIDIA TensorRT-LLM で大規模言語モデルの推論を最適化 http://www.open-lab.net/ja-jp/blog/optimizing-inference-on-llms-with-tensorrt-llm-now-publicly-available/ Thu, 19 Oct 2023 02:08:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=2176 Reading Time: 3 minutes NVIDIA は、NVIDIA GPU 上の最新の LLMの推論性能を高速化および最適化する TensorRT-LLM の一般提供を発表しました。このオープンソース ライブラリは、現在、/NVIDIA/TensorRT- … Continued]]> Reading Time: 3 minutes NVIDIA は、NVIDIA GPU 上の最新の LLMの推論性能を高速化および最適化する TensorRT-LLM の一般提供を発表しました。このオープンソース ライブラリは、現在、/NVIDIA/TensorRT-LLM GitHub レポジトリおよび NVIDIA NeMo フレームワークの一部として無料で提供されています。 大規模言語モデル (LLM) は人工知能の分野に革命をもたらし、デジタルの世界と対話するまったく新しい方法を生み出しました。しかし、世界中の組織やアプリケーション開発者が LLM を業務に取り入れようとする中で、これらのモデルを実行する上でのいくつかの課題が明らかになってきています。 簡単に言えば、LLM は巨大です。そのため、適切な技術がなければ、LLM の実行が遅くなり、

Source

]]>
2176
NVIDIA TensorRT-LLM が NVIDIA H100 GPU 上で大規模言語モデル推論をさらに強化 http://www.open-lab.net/ja-jp/blog/nvidia-tensorrt-llm-supercharges-large-language-model-inference-on-nvidia-h100-gpus/ Fri, 08 Sep 2023 01:18:36 +0000 http://www.open-lab.net/ja-jp/blog/?p=2019 Reading Time: 3 minutes 大規模言語モデルは驚くべき新機能を提供し、AI で実現できる領域を拡大しています。しかし、その大きなサイズと特有の実行特性は、費用対効果の高い方法で使用することを困難にすることがあります。 NVIDIA は、Meta、A … Continued]]> Reading Time: 3 minutes 大規模言語モデルは驚くべき新機能を提供し、AI で実現できる領域を拡大しています。しかし、その大きなサイズと特有の実行特性は、費用対効果の高い方法で使用することを困難にすることがあります。 NVIDIA は、Meta、AnyScale、Cohere、Deci、Grammarly、Mistral AI、MosaicML (現在は Databricks の一部)、OctoML、ServiceNow、Tabnine、Together AI、Uber などの主要な企業と緊密に協力し、LLM の推論の高速化と最適化に取り組んできました。 これらのイノベーションは、オープンソースの NVIDIA TensorRT-LLM ソフトウェアに統合され、Ampere、Lovelace、Hopper GPU に対応し、

Source

]]>
2019
NVIDIA CUDA Toolkit 12.2 がアプリケーションを強化する強力な機能をリリース http://www.open-lab.net/ja-jp/blog/nvidia-cuda-toolkit-12-2-unleashes-powerful-features-for-boosting-applications/ Thu, 06 Jul 2023 06:13:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=2064 Reading Time: 2 minutes NVIDIA CUDA Toolkit 12.2 の最新リリースでは、さまざまな重要な新機能、プログラミング モデルの変更、そして CUDA アプリケーションを加速するハードウェア機能のサポート強化が取り入れられています … Continued]]> Reading Time: 2 minutes NVIDIA CUDA Toolkit 12.2 の最新リリースでは、さまざまな重要な新機能、プログラミング モデルの変更、そして CUDA アプリケーションを加速するハードウェア機能のサポート強化が取り入れられています。 現在、NVIDIA から一般提供されている CUDA Toolkit 12.2 には、メジャーなものからマイナーなものまで、多くの新機能が含まれています。 この記事では、以下の主要機能の概要をご紹介します: NVIDIA は、アクセラレーテッド コンピューティングのパイオニアとして、世界で最も困難なコンピューティング課題の解決を支援するソリューションを創造しています。アクセラレーテッド コンピューティングには、チップ アーキテクチャ、システム、

Source

]]>
2064
CUDA Toolkit 12.0 の一般提供が開始 http://www.open-lab.net/ja-jp/blog/cuda-toolkit-12-0-released-for-general-availability/ Mon, 12 Dec 2022 10:14:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=1218 Reading Time: 3 minutes NVIDIA は、CUDA Toolkit ソフトウェアの最新リリースである 12.0 を発表しました。このリリースは、數年ぶりのメジャー リリースで、新しいプログラミング モデルと新しいハードウェア機能による CUDA … Continued]]> Reading Time: 3 minutes NVIDIA は、CUDA Toolkit ソフトウェアの最新リリースである 12.0 を発表しました。このリリースは、數年ぶりのメジャー リリースで、新しいプログラミング モデルと新しいハードウェア機能による CUDA アプリケーションの高速化に焦點を當てています。 詳細は、YouTube Premiere ウェビナー、CUDA 12.0: New Features and Beyond (CUDA 12.0: 新機能とその先) をご覧ください。 CUDA カスタム コード、拡張ライブラリ、および開発者ツールを使って、NVIDIA Hopper および NVIDIA Ada Lovelace アーキテクチャのアーキテクチャ固有の機能と命令を対象にアプリケーションをビルドできるようになりました。

Source

]]>
1218
CUDA Toolkit 11.8 の新機能が公開 http://www.open-lab.net/ja-jp/blog/cuda-toolkit-11-8-new-features-revealed/ Tue, 04 Oct 2022 03:37:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=941 Reading Time: < 1 minute NVIDIA は、CUDA ツールキットの最新ソフトウェア リリース 11.8 を発表しました。このリリースは、新しいハードウェア機能によるプログラミング モデルの強化と CUDA アプリケーションのスピードアップに重點 … Continued]]> Reading Time: < 1 minute NVIDIA は、CUDA ツールキットの最新ソフトウェア リリース 11.8 を発表しました。このリリースは、新しいハードウェア機能によるプログラミング モデルの強化と CUDA アプリケーションのスピードアップに重點を置いています。 NVIDIA Hopper および Ada Lovelace アーキテクチャ固有の新機能は、初めはライブラリとフレームワークの強化を通じて公開されます。NVIDIA Hopper アーキテクチャのための完全なプログラミング モデル強化は、CUDA Toolkit 12 ファミリからリリースされる予定です。 CUDA 11.8 はいくつかの重要な機能を備えています。この記事では、主要な機能の概要をご紹介します。 CUDA アプリケーションは、

Source

]]>
941
CUDA 11.6 ツールキットの新リリースを発表 http://www.open-lab.net/ja-jp/blog/cuda-11-6-toolkit-new-release-revealed/ Mon, 17 Jan 2022 06:04:00 +0000 http://www.open-lab.net/ja-jp/blog/?p=15 Reading Time: < 1 minute NVIDIA は、 CUDA 開発環境の最新リリースである CUDA 11.6 を発表しました。今回のリリースは、プログラミング モデルとアプリケーションのパフォーマンスの向上に焦點を當てています。 CUDA は、 GP … Continued]]> Reading Time: < 1 minute NVIDIA は、 CUDA 開発環境の最新リリースである CUDA 11.6 を発表しました。今回のリリースは、プログラミング モデルとアプリケーションのパフォーマンスの向上に焦點を當てています。 CUDA は、 GPU アクセラレーションの限界を押し広げ、HPC、ビジュアライゼーション、AI、ML と DL、データ サイエンスにおける新しいアプリケーションの基礎を築き続けます。 CUDA 11.6 にはいくつかの重要な機能があります。この記事では、主な機能の概要をご紹介します。 CUDA 11.6 にはアップデート ブランチである R510 ドライバーが同梱されています。 CUDA 11.6 ツールキットこちらからダウンロード可能です。 GSP ドライバー アーキテクチャは、

Source

]]>
15
人人超碰97caoporen国产