Top Stories

2025 年 4 月 10 日
NVIDIA のフルスタック ソリューションで AI 推論のパフォーマンスを最適化
NVIDIA は、AI 推論の可能性を再定義し、これまで以上に高速で、効率的かつ拡張可能なソリューションを提供するために、フルスタックのイノベーションを通じて開発者を支援しています。
2 MIN READ

2025 年 3 月 3 日
リランキングモデルによる RAG の日本語検索精度の向上
埋め込みモデルの Llama-3.2-NV-EmbedQA-1B-v2 およびリランキング モデルの Llama-3.2-NV-RerankQA-1B-v2 を利用して、日本語検索精度の高い RAG の構築方法を分かり易く解説します。
7 MIN READ

2024 年 12 月 17 日
NVIDIA Jetson Orin Nano 開発者キットを「Super」に強化
Jetson Orin Nano 開発者キットが、最大 1.7 倍の驚異的なパフォーマンス向上と新たな価格として $249 を実現しつつ、NVIDIA Jetson Orin Nano Super 開発者キットへと名稱が変更されました。
4 MIN READ

2024 年 11 月 11 日
Megatron-LM を用いた日本語に強い 172B 大規模言語モデルの開発
日本のモデル開発を促進するためのプロジェクトである GENIAC に採択された LLM-jp が、NVIDIA Megatron-LM を使用して、日本語に強い 172B オープンモデルの學習を高速化しました。
2 MIN READ

2024 年 11 月 6 日
NVIDIA NeMo による最先端のマルチモーダル生成 AI モデル開発
NeMo Curator を使用した大規模なデータ処理と、Cosmos トークナイザーを使用した高品質なトークン化やビジュアル再構築を備えた、NVIDIA NeMo プラットフォームで、最先端のマルチモーダル生成 AI モデルを構築しましょう。
2 MIN READ

2024 年 10 月 28 日
NVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化
NVIDIA GH200 Grace Hopper Superchip を活用し、システム スループットを犠牲にすることなく、x86 ベースの NVIDIA H100 サーバーと比較して、Llama 3 70B モデルでマルチターンでユーザーとのやり取りする場合、TTFT を最大 2 倍に向上させる方法について解説します。
2 MIN READ

2024 年 10 月 9 日
先進的なソブリン AI モデルが、日本のイノベーションとチャンスを解き放つ
東京科學大學と産業技術総合研究所が、Llama 3.1 をベースに、日本特有の言語的/文化的ニーズによりよく応えるように設計された獨自のソブリン AI モデル「Llama 3.1 Swallow」を共同開発しました。
2 MIN READ

2024 年 9 月 25 日
高速化された Llama 3.2 をエッジからクラウドへデプロイする
NVIDIA のアクセラレーテッド コンピューティング プラットフォームと組み合わせることで、Llama 3.2 は開発者、研究者、企業に、生成 AI のユース ケースを実現するための有益な新機能と最適化を提供します。
2 MIN READ

2024 年 9 月 25 日
NeMo Curator を使った日本語データのキュレーション
NeMo Curator を使用した、効率的な日本語データセットの構築方法をご紹介します。
7 MIN READ

2024 年 6 月 7 日
NVIDIA NIM で LoRA アダプター群をシームレスにデプロイ
LoRA の概要と、LoRA でファインチューニングされたモデルをデプロイする 2 つの方法、また LoRA アダプター群のヘテロジニアスな LoRA デプロイを可能にして、混合バッチ推論リクエストを可能にするためのアプローチについても説明します。
3 MIN READ

2024 年 5 月 3 日
VILA を使用した NVIDIA ハードウェア上のビジュアル言語モデル
NVIDIA の開発した VILA は、包括的な事前トレーニング、指示チューニング、デプロイ パイプラインを備えたビジュアル言語モデルであり、NVIDIA のクライアントがマルチモーダル製品で成功するのを支援します。
3 MIN READ

2024 年 4 月 15 日
本番環境への AI モデルのデプロイを効率化する NVIDIA NIM
NVIDIA AI Enterprise に含まれる NVIDIA NIM は、AI を活用するエンタープライズ アプリの開発と、AI モデルを本番環境にデプロイするための合理化された道のりを提供します。
2 MIN READ

2024 年 3 月 18 日
NVIDIA GB200 NVL72 は兆単位パラメーターの LLM トレーニングとリアルタイム推論を実現
新しい NVIDIA GB200 NVL72 は、計算負荷が高く、リソースを大量に消費する大規模なモデルのトレーニングとデプロイに対応するシステムの 1 つです。
4 MIN READ

2024 年 3 月 18 日
NVIDIA NeMo マイクロサービスでカスタム生成 AI 開発が簡単に
NeMo マイクロサービスである NVIDIA NeMo Curator、NVIDIA NeMo Customizer、NVIDIA NeMo Evaluator の早期アクセス プログラムが開始しました。
2 MIN READ

2023 年 11 月 15 日
NVIDIA AI Foundation モデル: 本番利用可能な LLM を使用して、企業向けのカスタムチャットボットとコパイロットを構築
大規模言語モデル (LLM) は自然言語理解、AI、機械學習における高度な機能を実現し、データ サイエンスに革命をもたらしています。
3 MIN READ

2023 年 11 月 15 日
Azure Machine Learning 上の NVIDIA AI で企業向け生成 AI アプリ開発を強化
生成 AI は、あらゆる産業において、データを活用して生産性を向上させ、パーソナライズされた顧客エンゲージメントを進め、
2 MIN READ