おすすめ

2024 年 11 月 22 日
Hymba ハイブリッド ヘッド アーキテクチャが小規模言語モデルのパフォーマンスを向上
Hymba 1.5B は、同様の規模である最先端のオープンソース モデルと比べ、良好なパフォーマンスを発揮し、同等のサイズの Transformer モデルで比較すると、Hymba はより高いスループットを発揮し、キャッシュを保存するために必要なメモリが 10 分の 1 で済みます。
4 MIN READ

2024 年 11 月 12 日
AI-RAN が通信事業者向けに新しい AI のビジネス チャンスをもたらす
SoftBank が、NVIDIA アクセラレーション ハードウェアと NVIDIA Aerial ソフトウェアを技術基盤として活用し、神奈川県藤沢市で屋外フィールド トライアルを成功させ、AI-RAN ビジョンを現実のものにしました。
4 MIN READ

2024 年 11 月 8 日
NVIDIA TensorRT-LLM の KV Cache Early Reuseで、Time to First Token を 5 倍高速化
KV キャッシュの再利用技術と、TTFT のさらなる高速化を実現するベストプラクティスについて解説します。
2 MIN READ

2024 年 10 月 31 日
NVIDIA NIM によるマルチモーダル ビジュアル AI エージェントの構築
NVIDIA NIM マイクロサービスを使用すれば、高度なビジュアル AI エージェントの構築がこれまで以上に簡単で効率的になります。
3 MIN READ

2024 年 10 月 28 日
LLM のモデル マージのご紹介
複數のカスタマイズされた LLM の重みを組み合わせることで、リソースの利用率を高めるモデル マージの、機能方法、種類、およびモデル マージがどのように繰り返され、進化しているのかについてご紹介します。
2 MIN READ

2024 年 10 月 8 日
通信會社に AI-RAN を提供
NVIDIA は、同じコンピューティング インフラストラクチャを使用して AI サービスと無線アクセス ネットワーク (RAN) サービスの処理が可能な AI-RAN の展開プラットフォームである Aerial RAN Computer-1 を導入しています。
5 MIN READ

2024 年 10 月 8 日
NVIDIA cuOpt で大規模な線形計畫問題を加速する
NVIDIA cuOpt は現在、GPU アクセラレーションで PDLP を実裝しています。最先端のアルゴリズム、NVIDIA ハードウェア、専用の CUDA 機能、NVIDIA GPU ライブラリを使用して、cuOpt LP ソルバーは、CPU ベースのソルバーと比較して 5,000 倍以上の高速パフォーマンスを実現しています。
3 MIN READ

2024 年 9 月 30 日
NVIDIA NIM Operator で Kubernetes の AI 推論パイプラインを管理
NIM Operator を使用すれば、わずか數回のクリックまたはコマンドで、NVIDIA NIM マイクロサービスのデプロイ、オートスケーリング、ライフサイクルを管理することができます。
2 MIN READ

2024 年 9 月 25 日
高速化された Llama 3.2 をエッジからクラウドへデプロイする
NVIDIA のアクセラレーテッド コンピューティング プラットフォームと組み合わせることで、Llama 3.2 は開発者、研究者、企業に、生成 AI のユース ケースを実現するための有益な新機能と最適化を提供します。
2 MIN READ

2024 年 9 月 23 日
Llama-3.1-Nemotron-51B による精度と効率の前進
NVIDIA は、比類のない精度と効率を実現する獨自の言語モデル、Llama 3.1-Nemotron-51B を発表しました。 Meta の Llama-3.1-70B の派生モデルであり、新しい Neural Architecture Search (NAS) アプローチによる、高精度かつ効率的なモデルです。
3 MIN READ

2024 年 6 月 28 日
NVIDIA NIM による財務分析の変革
金融サービスでは、ポートフォリオ マネージャーやリサーチ アナリストが膨大な量のデータを丹念に精査し、投資で競爭力を高めています。
4 MIN READ

2024 年 4 月 2 日
NVIDIA TensorRT-LLM による、LoRA LLM のチューニングとデプロイ
LLM のトレーニング コストを抑え、そのパワーを活用可能なファインチューニングの手法の 1 つである、Low-Rank Adaptation (LoRA) の洞察力と実裝について説明し、その応用と利點の一部をご紹介します。
7 MIN READ

2024 年 3 月 20 日
記録を塗り替え続ける NVIDIA cuOpt アルゴリズムがルート最適化ソリューションを 100 倍高速化
最適化アルゴリズムの主要な要素、その定義、業界をリードするソリューションに対して NVIDIA cuOpt のベンチマークを実行するプロセスについて掘り下げ、その比較の重要性に焦點を當ててご紹介します。
3 MIN READ

2024 年 3 月 18 日
NVIDIA GB200 NVL72 は兆単位パラメーターの LLM トレーニングとリアルタイム推論を実現
新しい NVIDIA GB200 NVL72 は、計算負荷が高く、リソースを大量に消費する大規模なモデルのトレーニングとデプロイに対応するシステムの 1 つです。
4 MIN READ

2024 年 3 月 18 日
NVIDIA NeMo Retriever で企業データを実用的なインサイトに変える
さまざまなデータ プラットフォーム企業が、NVIDIA と協力して NeMo Retriever を活用し、データを価値あるビジネス インサイトに変換している事例についてご紹介します。
2 MIN READ

2024 年 3 月 18 日
RAG アプリケーションを 4 つのステップでパイロットから本番環境に移行する方法
セキュリティ、サポート、安定性を提供する NVIDIA AI Enterprise は、企業による RAG アプリケーションのパイロットから本番環境への移行を支援します。
3 MIN READ