tutorial

2025 年 3 月 3 日

リランキングモデルによる RAG の日本語検索精度の向上

埋め込みモデルの Llama-3.2-NV-EmbedQA-1B-v2 およびリランキングモデルの Llama-3.2-NV-RerankQA-1B-v2 を利用して、日本語検索精度の高い RAG の構築方法を分かり易く解説します。

7 MIN READ

2025 年 2 月 6 日

Jetson プラットフォームサービス 2.0 の VLM ビデオ要約マイクロサービスの紹介

Jetpack 6.2 のリリースと同時にアップデートリリースされた Jetson プラットフォームサービス (Jetson Platform Services) の概要と、ハイライトの 1 つである「VLM ビデオ要約サービス」のデモをご紹介します。

6 MIN READ

2025 年 2 月 6 日

NeMo Framework と Megatron-Core の特徴や最新機能を紹介した動畫コンテンツを NVOD で公開

NVIDIA は 2024 年 11 月 12 日に、大規模言語モデル (LLM)…

2 MIN READ

2025 年 1 月 20 日

NeMo Framework で実踐する継続事前學習 - 日本語 LLM 編 -

フルスクラッチに比べ、少量のデータでもモデルを新しい言語やタスクに効果的に適応させることができる継続事前學習を実行する方法を、NeMo Framework を使用して解説します。

3 MIN READ

2024 年 12 月 17 日

NeMo Curator を使った日本語テキストデータのドメイン分類

NeMo Curator は、日本のソブリン LLM の構築や更新のためのデータセットを準備するために、日本語をサポートする多言語ドメイン分類器をリリースしました。

3 MIN READ

2024 年 12 月 11 日

NVIDIA AI Blueprint でカスタマーサービス向けの AI バーチャルアシスタントを作成する 3 つの構成要素

NIM と NeMo? Retriever を活用したリファレンスアプリケーションである NVIDIA NIM? AI Blueprint を使用して、あらゆる業界のカスタマーサービスを変革しましょう。

2 MIN READ

2024 年 11 月 21 日

NVIDIA NIM でファインチューニングされた AI モデルのデプロイ

パフォーマンスを最適化した TensorRT-LLM 推論エンジンをローカルでビルドして、SFT でカスタマイズされたモデルに対する NIM マイクロサービスを迅速にデプロイする方法を説明します。

2 MIN READ

2024 年 11 月 8 日

NeMo Framework で日本語 LLM をファインチューニング - DPO 編 -

NeMo Framework を使用して、日本語の大規模言語モデル (LLM) で、人間の嗜好や価値観に沿うようにモデルを調整するアライメント手法の一つである、DPO (Direct Preference Optimization) を実行する方法を説明します。

4 MIN READ

2024 年 10 月 28 日

LLM のモデルマージのご紹介

複數のカスタマイズされた LLM の重みを組み合わせることで、リソースの利用率を高めるモデルマージの、機能方法、種類、およびモデルマージがどのように繰り返され、進化しているのかについてご紹介します。

2 MIN READ

2024 年 10 月 16 日

NeMo Guardrails により LLM の脆弱性を防ぐ: 導入編

プログラム可能なガードレールを LLM ベースの対話システムに簡単に追加するための OSS 機能である NeMo Guardrails の詳細や導入方法を解説します。

3 MIN READ

2024 年 10 月 16 日

NeMo Guardrails により LLM の脆弱性を防ぐ: ジェイルブレイク防止編

LLM ベースの対話型アプリケーションにガードレールを追加するオープンソースのツールキット「NeMo Guardrails」の Input Rails を用いたジェイルブレイク防止のチュートリアルを試します。

8 MIN READ

2024 年 9 月 25 日

NVIDIA NIM Agent Blueprint で AI アプリ向けのデジタルヒューマンインターフェイスを構築する

デジタルヒューマンインターフェイスを追加してチャットボットアプリケーションをパーソナライズし、検索拡張生成 (RAG) を使用して、スムーズで人間のようなやりとりを提供するサービスを構築してみませんか?

2 MIN READ

2024 年 9 月 25 日

NeMo Curator を使った日本語データのキュレーション

NeMo Curator を使用した、効率的な日本語データセットの構築方法をご紹介します。

7 MIN READ

2024 年 7 月 18 日

Transformer Engine ではじめる FP8 Training (導入編)

Transformer Engine とは、Transformer モデルの學習を効率的に行うためのオープンソースライブラリで、GPU における Transformer モデルの學習効率を大幅に向上します。

5 MIN READ

2024 年 7 月 12 日

NVIDIA cuOpt でルート最適化に革命を起こす

世界記録を持つ GPU 対応最適化 AI マイクロサービスであり、複雑なルーティング問題をチームで解決する際に役立つ NVIDIA cuOpt を、既存環境にデプロイする方法についてご紹介します。

2 MIN READ

2024 年 7 月 3 日

NeMo Framework で日本語 LLM をファインチューニング - SFT 編 -

NeMo Framework を使用して、日本語の大規模言語モデル (LLM) の SFT (Supervised Fine-Tuning: ファインチューニングの手法の一種) を実行する方法をご紹介します。

4 MIN READ

tutorial

リランキングモデルによる RAG の日本語検索精度の向上

Jetson プラットフォーム サービス 2.0 の VLM ビデオ要約マイクロサービスの紹介

NeMo Framework と Megatron-Core の特徴や最新機能を紹介した動畫コンテンツを NVOD で公開

NeMo Framework で実踐する継続事前學習 - 日本語 LLM 編 -

NeMo Curator を使った日本語テキスト データのドメイン分類

NVIDIA AI Blueprint でカスタマー サービス向けの AI バーチャル アシスタントを作成する 3 つの構成要素

NVIDIA NIM でファインチューニングされた AI モデルのデプロイ

NeMo Framework で日本語 LLM をファインチューニング - DPO 編 -

LLM のモデル マージのご紹介

NeMo Guardrails により LLM の脆弱性を防ぐ: 導入編

NeMo Guardrails により LLM の脆弱性を防ぐ: ジェイルブレイク防止編

NVIDIA NIM Agent Blueprint で AI アプリ向けのデジタル ヒューマン インターフェイスを構築する

NeMo Curator を使った日本語データのキュレーション

Transformer Engine ではじめる FP8 Training (導入編)

NVIDIA cuOpt でルート最適化に革命を起こす

NeMo Framework で日本語 LLM をファインチューニング - SFT 編 -

Jetson プラットフォームサービス 2.0 の VLM ビデオ要約マイクロサービスの紹介

NeMo Curator を使った日本語テキストデータのドメイン分類

NVIDIA AI Blueprint でカスタマーサービス向けの AI バーチャルアシスタントを作成する 3 つの構成要素

LLM のモデルマージのご紹介

NVIDIA NIM Agent Blueprint で AI アプリ向けのデジタルヒューマンインターフェイスを構築する