Japanese Tutorial

2025 年 3 月 3 日
リランキングモデルによる RAG の日本語検索精度の向上
埋め込みモデルの Llama-3.2-NV-EmbedQA-1B-v2 およびリランキング モデルの Llama-3.2-NV-RerankQA-1B-v2 を利用して、日本語検索精度の高い RAG の構築方法を分かり易く解説します。
7 MIN READ

2025 年 1 月 20 日
NeMo Framework で実踐する継続事前學習 - 日本語 LLM 編 -
フルスクラッチに比べ、少量のデータでもモデルを新しい言語やタスクに効果的に適応させることができる継続事前學習を実行する方法を、NeMo Framework を使用して解説します。
3 MIN READ

2024 年 11 月 8 日
NeMo Framework で日本語 LLM をファインチューニング - DPO 編 -
NeMo Framework を使用して、日本語の大規模言語モデル (LLM) で、人間の嗜好や価値観に沿うようにモデルを調整するアライメント手法の一つである、DPO (Direct Preference Optimization) を実行する方法を説明します。
4 MIN READ

2024 年 10 月 16 日
NeMo Guardrails により LLM の脆弱性を防ぐ: 導入編
プログラム可能なガードレールを LLM ベースの対話システムに簡単に追加するための OSS 機能である NeMo Guardrails の詳細や導入方法を解説します。
3 MIN READ

2024 年 10 月 16 日
NeMo Guardrails により LLM の脆弱性を防ぐ: ジェイルブレイク防止編
LLM ベースの対話型アプリケーションにガードレールを追加するオープン ソースのツールキット「NeMo Guardrails」の Input Rails を用いたジェイルブレイク防止のチュートリアルを試します。
8 MIN READ

2024 年 9 月 25 日
NeMo Curator を使った日本語データのキュレーション
NeMo Curator を使用した、効率的な日本語データセットの構築方法をご紹介します。
7 MIN READ

2024 年 7 月 18 日
Transformer Engine ではじめる FP8 Training (導入編)
Transformer Engine とは、Transformer モデルの學習を効率的に行うためのオープンソース ライブラリで、GPU における Transformer モデルの學習効率を大幅に向上します。
5 MIN READ

2024 年 7 月 3 日
NeMo Framework で日本語 LLM をファインチューニング - SFT 編 -
NeMo Framework を使用して、日本語の大規模言語モデル (LLM) の SFT (Supervised Fine-Tuning: ファインチューニングの手法の一種) を実行する方法をご紹介します。
4 MIN READ

2024 年 5 月 29 日
GenerativeAIExamples と NVIDIA API カタログを用いて Retrieval Augmented Generation を活用した LLM チャットボットを作成
GenerativeAIExamples と NVIDIA API カタログを用いて LLM と RAG を組み合わせたアプリケーションを簡単にデプロイする方法についてご紹介します。
4 MIN READ

2024 年 2 月 7 日
NeMo Framework で日本語 LLM を簡単デプロイ - オンライン推論編 -
本記事では、Hugging Face Model Hub から日本語 LLM をダウンロードして、Nemo Framework Inference コンテナーを使用して GPU 推論する方法について具體的な手順を解説します。
3 MIN READ

2023 年 11 月 28 日
NeMo Framework で日本語 LLM をファインチューニング - PEFT 編 -
ご注意: この記事は NeMo Framework のアップデートのため、2024 年 6 月 10 日に大幅に変更を加えました。
3 MIN READ