Top Stories

2025 年 4 月 10 日

NVIDIA のフルスタックソリューションで AI 推論のパフォーマンスを最適化

NVIDIA は、AI 推論の可能性を再定義し、これまで以上に高速で、効率的かつ拡張可能なソリューションを提供するために、フルスタックのイノベーションを通じて開発者を支援しています。

2 MIN READ

2025 年 3 月 3 日

リランキングモデルによる RAG の日本語検索精度の向上

埋め込みモデルの Llama-3.2-NV-EmbedQA-1B-v2 およびリランキングモデルの Llama-3.2-NV-RerankQA-1B-v2 を利用して、日本語検索精度の高い RAG の構築方法を分かり易く解説します。

7 MIN READ

2024 年 12 月 17 日

NVIDIA Jetson Orin Nano 開発者キットを「Super」に強化

Jetson Orin Nano 開発者キットが、最大 1.7 倍の驚異的なパフォーマンス向上と新たな価格として $249 を実現しつつ、NVIDIA Jetson Orin Nano Super 開発者キットへと名稱が変更されました。

4 MIN READ

2024 年 11 月 11 日

Megatron-LM を用いた日本語に強い 172B 大規模言語モデルの開発

日本のモデル開発を促進するためのプロジェクトである GENIAC に採択された LLM-jp が、NVIDIA Megatron-LM を使用して、日本語に強い 172B オープンモデルの學習を高速化しました。

2 MIN READ

2024 年 11 月 6 日

NVIDIA NeMo による最先端のマルチモーダル生成 AI モデル開発

NeMo Curator を使用した大規模なデータ処理と、Cosmos トークナイザーを使用した高品質なトークン化やビジュアル再構築を備えた、NVIDIA NeMo プラットフォームで、最先端のマルチモーダル生成 AI モデルを構築しましょう。

2 MIN READ

2024 年 10 月 28 日

NVIDIA GH200 Superchip が、Llama モデルとのマルチターンインタラクションの推論を 2 倍高速化

NVIDIA GH200 Grace Hopper Superchip を活用し、システムスループットを犠牲にすることなく、x86 ベースの NVIDIA H100 サーバーと比較して、Llama 3 70B モデルでマルチターンでユーザーとのやり取りする場合、TTFT を最大 2 倍に向上させる方法について解説します。

2 MIN READ

2024 年 10 月 9 日

先進的なソブリン AI モデルが、日本のイノベーションとチャンスを解き放つ

東京科學大學と産業技術総合研究所が、Llama 3.1 をベースに、日本特有の言語的/文化的ニーズによりよく応えるように設計された獨自のソブリン AI モデル「Llama 3.1 Swallow」を共同開発しました。

2 MIN READ

2024 年 9 月 25 日

高速化された Llama 3.2 をエッジからクラウドへデプロイする

NVIDIA のアクセラレーテッドコンピューティングプラットフォームと組み合わせることで、Llama 3.2 は開発者、研究者、企業に、生成 AI のユースケースを実現するための有益な新機能と最適化を提供します。

2 MIN READ

2024 年 9 月 25 日

NeMo Curator を使った日本語データのキュレーション

NeMo Curator を使用した、効率的な日本語データセットの構築方法をご紹介します。

7 MIN READ

2024 年 6 月 7 日

NVIDIA NIM で LoRA アダプター群をシームレスにデプロイ

LoRA の概要と、LoRA でファインチューニングされたモデルをデプロイする 2 つの方法、また LoRA アダプター群のヘテロジニアスな LoRA デプロイを可能にして、混合バッチ推論リクエストを可能にするためのアプローチについても説明します。

3 MIN READ

2024 年 5 月 3 日

VILA を使用した NVIDIA ハードウェア上のビジュアル言語モデル

NVIDIA の開発した VILA は、包括的な事前トレーニング、指示チューニング、デプロイパイプラインを備えたビジュアル言語モデルであり、NVIDIA のクライアントがマルチモーダル製品で成功するのを支援します。

3 MIN READ

2024 年 4 月 15 日

本番環境への AI モデルのデプロイを効率化する NVIDIA NIM

NVIDIA AI Enterprise に含まれる NVIDIA NIM は、AI を活用するエンタープライズアプリの開発と、AI モデルを本番環境にデプロイするための合理化された道のりを提供します。

2 MIN READ

2024 年 3 月 18 日

NVIDIA GB200 NVL72 は兆単位パラメーターの LLM トレーニングとリアルタイム推論を実現

新しい NVIDIA GB200 NVL72 は、計算負荷が高く、リソースを大量に消費する大規模なモデルのトレーニングとデプロイに対応するシステムの 1 つです。

4 MIN READ

2024 年 3 月 18 日

NVIDIA NeMo マイクロサービスでカスタム生成 AI 開発が簡単に

NeMo マイクロサービスである NVIDIA NeMo Curator、NVIDIA NeMo Customizer、NVIDIA NeMo Evaluator の早期アクセスプログラムが開始しました。

2 MIN READ

2023 年 11 月 15 日

NVIDIA AI Foundation モデル: 本番利用可能な LLM を使用して、企業向けのカスタムチャットボットとコパイロットを構築

大規模言語モデル (LLM) は自然言語理解、AI、機械學習における高度な機能を実現し、データサイエンスに革命をもたらしています。

3 MIN READ

2023 年 11 月 15 日

Azure Machine Learning 上の NVIDIA AI で企業向け生成 AI アプリ開発を強化

生成 AI は、あらゆる産業において、データを活用して生産性を向上させ、パーソナライズされた顧客エンゲージメントを進め、

2 MIN READ

Top Stories

NVIDIA のフルスタック ソリューションで AI 推論のパフォーマンスを最適化

リランキングモデルによる RAG の日本語検索精度の向上

NVIDIA Jetson Orin Nano 開発者キットを「Super」に強化

Megatron-LM を用いた日本語に強い 172B 大規模言語モデルの開発

NVIDIA NeMo による最先端のマルチモーダル生成 AI モデル開発

NVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化

先進的なソブリン AI モデルが、日本のイノベーションとチャンスを解き放つ

高速化された Llama 3.2 をエッジからクラウドへデプロイする

NeMo Curator を使った日本語データのキュレーション

NVIDIA NIM で LoRA アダプター群をシームレスにデプロイ

VILA を使用した NVIDIA ハードウェア上のビジュアル言語モデル

本番環境への AI モデルのデプロイを効率化する NVIDIA NIM

NVIDIA GB200 NVL72 は兆単位パラメーターの LLM トレーニングとリアルタイム推論を実現

NVIDIA NeMo マイクロサービスでカスタム生成 AI 開発が簡単に

NVIDIA AI Foundation モデル: 本番利用可能な LLM を使用して、企業向けのカスタムチャットボットとコパイロットを構築

Azure Machine Learning 上の NVIDIA AI で企業向け生成 AI アプリ開発を強化

NVIDIA のフルスタックソリューションで AI 推論のパフォーマンスを最適化

NVIDIA GH200 Superchip が、Llama モデルとのマルチターンインタラクションの推論を 2 倍高速化