Advanced Technical

2024 年 4 月 2 日
NVIDIA TensorRT-LLM による、LoRA LLM のチューニングとデプロイ
LLM のトレーニング コストを抑え、そのパワーを活用可能なファインチューニングの手法の 1 つである、Low-Rank Adaptation (LoRA) の洞察力と実裝について説明し、その応用と利點の一部をご紹介します。
7 MIN READ

2024 年 3 月 14 日
LLM アーキテクチャにおける Mixture of Experts の適用
Mixture of Experts (MoE) 大規模言語モデル (LLM) アーキテクチャは、GPT-4 などの商用の LLM と…
4 MIN READ

2023 年 11 月 17 日
LLM テクニックの習得: 推論の最適化
LLM 推論における最も差し迫った課題と、いくつかの実用的な解決策について説明します。
6 MIN READ

2023 年 11 月 14 日
ハイパフォーマンス コンピューティングにおけるエネルギー効率: スピードと持続可能性のバランス
コンピューティングの世界は劇的な転換期にあります。 コンピューティング性能、特にハイパフォーマンス コンピューティング (HPC)…
5 MIN READ