ディープラーニング ソフトウェア
NVIDIA CUDA-X AI ã¯ã€ç ”究者やソフトウェア開発者ãŒã€å¯¾è©±åž‹ AIã€ãƒ¬ã‚³ãƒ¡ãƒ³ãƒ€ãƒ¼ システムã€ã‚³ãƒ³ãƒ”ューター ビジョンå‘ã‘ã®é«˜æ€§èƒ½ãª GPU アクセラレーション アプリケーションを構築ã™ã‚‹ãŸã‚ã®å®Œå…¨ãªãƒ‡ã‚£ãƒ¼ãƒ—ラーニング ソフトウェア スタックã§ã™ã€‚CUDA-X AI ライブラリã¯ã€MLPerf ãªã©ã®ã•ã¾ã–ã¾ãªæ¥ç•Œãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã«ãŠã„ã¦ã€ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã¨æŽ¨è«–ã®ä¸¡æ–¹ã§ä¸–界をリードã™ã‚‹ãƒ‘フォーマンスを発æ®ã—ã¦ã„ã¾ã™ã€‚
TensorFlowã€PyTorch〠JAX ã‚’ã¯ã˜ã‚ã€ã™ã¹ã¦ã®ãƒ‡ã‚£ãƒ¼ãƒ—ラーニング フレームワークã¯ã€ã‚·ãƒ³ã‚°ãƒ« GPU ã§ã®ã‚¢ã‚¯ã‚»ãƒ©ãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ã«å¯¾å¿œã—ã¦ãŠã‚Šã€ãƒžãƒ«ãƒ GPU やマルãƒãƒŽãƒ¼ãƒ‰ã®æ§‹æˆã«ã‚ˆã‚‹ã‚¹ã‚±ãƒ¼ãƒ«ã‚¢ãƒƒãƒ—ã‚‚å¯èƒ½ã§ã™ã€‚フレームワークã®é–‹ç™ºè€…ã‚„ç ”ç©¶è€…ã¯ã€GPU ã«æœ€é©åŒ–ã•ã‚ŒãŸ CUDA-X AI ライブラリã®æŸ”軟性を利用ã—ã¦ã€æ–°ã—ã„フレームワークやモデル アーã‚テクãƒãƒ£ã‚’高速化ã§ãã¾ã™ã€‚
CUDA-X をベースã¨ã™ã‚‹ NVIDIA ã®çµ±åˆãƒ—ãƒã‚°ãƒ©ãƒŸãƒ³ã‚° モデルã«ã‚ˆã‚Šã€ãƒ‡ã‚¹ã‚¯ãƒˆãƒƒãƒ—やデータセンターã§ãƒ‡ã‚£ãƒ¼ãƒ—ラーニング アプリケーションを開発ã—ã¦ã€ãƒ‡ãƒ¼ã‚¿ã‚»ãƒ³ã‚¿ãƒ¼ã€ãƒªã‚½ãƒ¼ã‚¹ã«åˆ¶ç´„ã®ã‚ã‚‹ IoT デãƒã‚¤ã‚¹ã€è‡ªå‹•è»Šãƒ—ラットフォームã«æœ€å°é™ã®ã‚³ãƒ¼ãƒ‰å¤‰æ›´ã§å±•é–‹ã§ãã¾ã™ã€‚
NVIDIA? NGC? ã‚«ã‚¿ãƒã‚° ã§ã¯ã€ä¸€èˆ¬çš„ãªãƒ‡ã‚£ãƒ¼ãƒ—ラーニング モデルå‘ã‘ã®å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã€ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚° スクリプトã€æœ€é©åŒ–ã•ã‚ŒãŸãƒ•ãƒ¬ãƒ¼ãƒ ワーク コンテナーã€æŽ¨è«–エンジンをæä¾›ã—ã¦ã„ã¾ã™ã€‚NVIDIA AI Toolkit ã«ã¯ã€å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã®è»¢ç§»å¸ç¿’ã€å¾®èª¿æ•´ã€æœ€é©åŒ–ã€å±•é–‹ã®ãŸã‚ã®ãƒ©ã‚¤ãƒ–ラリãŒå«ã¾ã‚Œã¦ãŠã‚Šã€å¹…広ã„æ¥ç•Œã‚„ AI ワークãƒãƒ¼ãƒ‰ã«å¯¾å¿œã—ã¦ã„ã¾ã™ã€‚
NVIDIA Github ã«ã¯ã€å„種ã®è£½å“ã€ãƒ‡ãƒ¢ã€ã‚µãƒ³ãƒ—ルã€ãƒãƒ¥ãƒ¼ãƒˆãƒªã‚¢ãƒ«ã® 100 を超ãˆã‚‹ãƒªãƒã‚¸ãƒˆãƒªãŒã‚ã‚‹ãŸã‚ã€ã™ãã«å§‹ã‚られã¾ã™ã€‚
ã‚らゆるフレームワークã¨ã®çµ±åˆ
ディープラーニング フレームワークã¯ã€é«˜åº¦ãªãƒ—ãƒã‚°ãƒ©ãƒŸãƒ³ã‚° インターフェイスã‹ã‚‰ãƒ‡ã‚£ãƒ¼ãƒ— ニューラル ãƒãƒƒãƒˆãƒ¯ãƒ¼ã‚¯ã‚’è¨è¨ˆã€ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã€æ¤œè¨¼ã™ã‚‹ãŸã‚ã®ãƒ“ルディング ブãƒãƒƒã‚¯ã‚’æä¾›ã—ã¾ã™ã€‚PyTorch ã‚„ TensorFlowã€JAX ãªã©ã®åºƒã使用ã•ã‚Œã‚‹ãƒ‡ã‚£ãƒ¼ãƒ—ラーニング フレームワーク㧠cuDNN ã‚„ TensorRT ãªã©ã® GPU アクセラレーション ライブラリを利用ã™ã‚‹ã“ã¨ã«ã‚ˆã‚Šã€GPU ã§é«˜é€ŸåŒ–ã•ã‚Œã‚‹ãƒã‚¤ãƒ‘フォーマンスãªãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã‚„推論を実ç¾ã§ãã¾ã™ã€‚
NGC ã§ã¯ã€æœ€æ–°ã® GPU ã«æœ€é©åŒ–ã•ã‚Œã€CUDA ライブラリãŠã‚ˆã³ãƒ‰ãƒ©ã‚¤ãƒãƒ¼ã¨çµ±åˆã•ã‚ŒãŸã‚³ãƒ³ãƒ†ãƒŠãƒ¼åŒ–ã•ã‚ŒãŸãƒ•ãƒ¬ãƒ¼ãƒ ワークをæä¾›ã—ã¦ã„ã¾ã™ã€‚毎月ã®ãƒªãƒªãƒ¼ã‚¹ã®ä¸€ç’°ã¨ã—ã¦æ¤œè¨¼ã¨ãƒ†ã‚¹ãƒˆãŒå®Ÿæ–½ã•ã‚Œã¦ãŠã‚Šã€ã•ã¾ã–ã¾ãªã‚¨ãƒƒã‚¸ã‚„クラウド プラットフォームã§æœ€é«˜ã®ãƒ‘フォーマンスãŒå¾—られるよã†ã«ãªã£ã¦ã„ã¾ã™ã€‚フレームワークã¨ã®çµ±åˆã€ãƒªã‚½ãƒ¼ã‚¹ã€ã‚µãƒ³ãƒ—ルã®è©³ç´°ã‚’確èªã—ã¦ã€åˆ©ç”¨ã‚’開始ã™ã‚‹ã«ã¯ã€ãƒ‡ã‚£ãƒ¼ãƒ—ラーニング フレームワークã®ãƒšãƒ¼ã‚¸ã‚’ã”覧ãã ã•ã„。

ディープラーニング トレーニング
CUDA-X AI ライブラリã¯ã€ã‚らゆるフレームワークã«ãŠã‘るディープラーニング ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã‚’åŠ é€Ÿã•ã›ã¾ã™ã€‚ãã®é«˜æ€§èƒ½ãªæœ€é©åŒ–ã«ã‚ˆã‚Šã€å¯¾è©±åž‹ AIã€è‡ªç„¶è¨€èªžç†è§£ã€ãƒ¬ã‚³ãƒ¡ãƒ³ãƒ€ãƒ¼ システムã€ã‚³ãƒ³ãƒ”ューター ビジョンãªã©ã®ã•ã¾ã–ã¾ãªã‚¢ãƒ—リケーションã§ã€GPU ã«ã‚ˆã‚‹ä¸–界トップクラスã®ãƒ‘フォーマンスを実ç¾ã—ã¦ã„ã¾ã™ã€‚最新㮠GPU 性能ã¯ã€ãƒ‡ã‚£ãƒ¼ãƒ—ラーニング トレーニング パフォーマンスã®ãƒšãƒ¼ã‚¸ã§ã„ã¤ã§ã‚‚ã”確èªã„ãŸã ã‘ã¾ã™ã€‚
GPU アクセラレーション フレームワークを使用ã™ã‚‹ã¨ã€Tensor コアã§ã®æ··åˆç²¾åº¦æ¼”ç®—ãªã©ã®æœ€é©åŒ–ã«ã‚ˆã‚Šã€ã•ã¾ã–ã¾ãªç¨®é¡žã®ãƒ¢ãƒ‡ãƒ«ã‚’高速化ã§ãã‚‹ã»ã‹ã€ã‚·ãƒ³ã‚°ãƒ« GPU 上ã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚° ジョブをã€æ•¸åƒã‚‚ã® GPU ã‹ã‚‰æˆã‚‹ DGX SuperPOD ã«ã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°ã™ã‚‹ã®ã‚‚ç°¡å˜ã§ã™ã€‚
ディープラーニングãŒè¨€èªžç†è§£ã‚„対話型 AI ã¨ã„ã£ãŸè¤‡é›‘ãªã‚¿ã‚¹ã‚¯ã«é©ç”¨ã•ã‚Œã‚‹ã‚ˆã†ã«ãªã‚‹ã«ã¤ã‚Œã€ãƒ¢ãƒ‡ãƒ«ã®ã‚µã‚¤ã‚ºã¨ãã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã«å¿…è¦ãªã‚³ãƒ³ãƒ”ューティング リソースãŒçˆ†ç™ºçš„ã«å¢—大ã—ã¦ã„ã¾ã™ã€‚一般的ãªã‚¢ãƒ—ãƒãƒ¼ãƒã§ã¯ã€æ±Žç”¨çš„ãªãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§äº‹å‰ã«ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã•ã‚ŒãŸãƒ¢ãƒ‡ãƒ«ã‹ã‚‰é–‹å§‹ã—ã€ç‰¹å®šã®æ¥ç•Œã€ãƒ‰ãƒ¡ã‚¤ãƒ³ã€ãƒ¦ãƒ¼ã‚¹ ケースã«åˆã‚ã›ã¦å¾®èª¿æ•´ã‚’è¡Œã„ã¾ã™ã€‚NVIDIA AI ツールã‚ットã§ã¯ã€å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã‹ã‚‰é–‹å§‹ã—ã¦è»¢ç§»å¸ç¿’や微調整を行ã†ãŸã‚ã®ãƒ©ã‚¤ãƒ–ラリやツールをæä¾›ã—ã¦ã„ã‚‹ãŸã‚ã€ç¨è‡ªã® AI アプリケーションã®æ€§èƒ½ã¨ç²¾åº¦ã‚’最大é™ã«é«˜ã‚ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚

Data Loading Library (DALI) ã¯ã€GPU アクセラレーションを利用ã—ãŸãƒ‡ãƒ¼ã‚¿æ‹¡å¼µãŠã‚ˆã³ç•«åƒèªã¿è¾¼ã¿ãƒ©ã‚¤ãƒ–ラリã§ã™ã€‚ディープラーニング フレームワークã®ãƒ‡ãƒ¼ã‚¿ パイプラインを最é©åŒ–ã§ãã¾ã™ã€‚
詳細を見る

CUDA Deep Neural Network (cuDNN) ã¯ã€ç•³ã¿è¾¼ã¿ã€æ´»æ€§åŒ–関數ã€ãƒ†ãƒ³ã‚½ãƒ«å¤‰æ›ã®ãŸã‚ã®ãƒ‡ã‚£ãƒ¼ãƒ—ラーニング プリミティブãªã©ã€ãƒ‡ã‚£ãƒ¼ãƒ— ニューラル ãƒãƒƒãƒˆãƒ¯ãƒ¼ã‚¯ アプリケーション用ã®ãƒ“ルディング ブãƒãƒƒã‚¯ã‚’å‚™ãˆãŸé«˜æ€§èƒ½ãƒ©ã‚¤ãƒ–ラリã§ã™ã€‚
詳細を見る
NVIDIA Collective Communications Library (NCCL) ã¯ã€all-gatherã€reduceã€broadcast ãªã©ã®ãƒ«ãƒ¼ãƒãƒ³ã«ã‚ˆã‚Šã€æœ€å¤§ 8 基ã¾ã§æ‹¡å¼µå¯èƒ½ãªãƒžãƒ«ãƒ GPU 通信を高速化ã—ã¾ã™ã€‚
詳細を見る

NVIDIA Neural Modules (NeMo) ã¯ã€AI アクセラレーションを利用ã—ãŸéŸ³è²ãŠã‚ˆã³è¨€èªžã‚¢ãƒ—リケーションã®ãŸã‚ã®æœ€å…ˆç«¯ã®ãƒ‹ãƒ¥ãƒ¼ãƒ©ãƒ« ãƒãƒƒãƒˆãƒ¯ãƒ¼ã‚¯ã‚’構築ã§ãるオープンソース ツールã‚ットã§ã™ã€‚
詳細を見る

TAO ツールã‚ット ã¯ã€AI ã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã‚’高速化ã™ã‚‹ãŸã‚ã® Python ベースã®ãƒ„ールã‚ットã§ã€å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã®æœ€é©åŒ–や転移å¸ç¿’ã®é©ç”¨ã«ã‚ˆã‚Šã€é«˜ã„精度を実ç¾ã§ãã¾ã™ã€‚å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã¯ã€DeepStream SDK ã‚„ TensorRT を使用ã™ã‚‹ã“ã¨ã§ NVIDIA エッジ プラットフォーム上ã§åŠ¹çŽ‡çš„ã«ãƒ—ルーニングã—ã¦å±•é–‹ã§ãã‚‹ãŸã‚ã€é«˜æ€§èƒ½ AI システムã®æ§‹ç¯‰ãŒå¯èƒ½ã§ã™ã€‚
詳細を見る
NVIDIA Deep Learning GPU Training System (DIGITS) ã¯ã€ãƒ‡ãƒ¼ã‚¿ã®ç®¡ç†ã€ãƒžãƒ«ãƒ GPU システムã®ã‚³ãƒ³ãƒ”ューター ビジョン ãƒãƒƒãƒˆãƒ¯ãƒ¼ã‚¯ã®è¨è¨ˆã¨ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã€ãƒªã‚¢ãƒ«ã‚¿ã‚¤ãƒ ã®ãƒ‘フォーマンス監視ãŒå¯èƒ½ãªã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ãƒ†ã‚£ãƒ–ãªãƒ„ールã§ã€å±•é–‹ç”¨ã«æœ€é©ãªãƒ‘フォーマンスã®ãƒ¢ãƒ‡ãƒ«ã‚’é¸åˆ¥ã§ãã¾ã™ã€‚
詳細を見る

AI-Assisted Annotation ツールã‚ット を使用ã™ã‚‹ã¨ã€ã‚¯ãƒ©ã‚¤ã‚¢ãƒ³ãƒˆ API ã¨å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã‚’介ã—ã¦ã€é†«ç™‚ビューアーを AI 対応ã«ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚
詳細を見る
ディープラーニング推論
CUDA-X AI ã«ã¯ã€ã‚³ãƒ³ãƒ”ューター ビジョンã€å¯¾è©±åž‹ AIã€ãƒ¬ã‚³ãƒ¡ãƒ³ãƒ€ãƒ¼ システムãªã©ã®ã‚¢ãƒ—リケーションをé‹ç”¨ç’°å¢ƒ ã§å®Ÿè¡Œã™ã‚‹éš›ã«ã€ãƒ¬ã‚¤ãƒ†ãƒ³ã‚·ã‚’最å°é™ã«æŠ‘ãˆã€ã‚¹ãƒ«ãƒ¼ãƒ—ットを最大é™ã«é«˜ã‚ã‚‹ ã“ã¨ãŒã§ãる高性能ディープラーニング推論 SDK ãŒå«ã¾ã‚Œã¦ã„ã¾ã™ã€‚NVIDIA ã®æŽ¨è«– SDK ã§é–‹ç™ºã•ã‚ŒãŸã‚¢ãƒ—リケーションã¯ã€CPU ã®ã¿ã®ãƒ—ラットフォームã¨æ¯”較ã—ã¦ã€GPU ã«ã‚ˆã‚‹æœ€å¤§ 40 å€ã®æŽ¨è«–性能を実ç¾ã§ãã¾ã™ã€‚
CUDA çµ±åˆãƒ—ラットフォームをベースã«ã—ã¦æ§‹ç¯‰ã•ã‚ŒãŸ NVIDIA ã® CUDA-X 推論ソリューションã¯ã€ãƒ‡ã‚¹ã‚¯ãƒˆãƒƒãƒ—上ã§ä»»æ„ã®ãƒ•ãƒ¬ãƒ¼ãƒ ワークを用ã„ã¦ãƒ¢ãƒ‡ãƒ«ã‚’開発ã—ã€æœ€é©åŒ–ã‚’é©ç”¨ã—ã¦ã€æŽ¨è«–用ã«ãƒ‡ãƒ¼ã‚¿ã‚»ãƒ³ã‚¿ãƒ¼ãŠã‚ˆã³ã‚¨ãƒƒã‚¸ã«ç°¡å˜ã«å±•é–‹ã§ãã¾ã™ã€‚
対話型 AI やレコメンダー システムã®ã‚¢ãƒ—リケーション パイプラインã§ã¯ã€é¡§å®¢ã‹ã‚‰ã®å•ã„åˆã‚ã› 1 件ã‚ãŸã‚Š 20 ~ 30 個ã®ãƒ¢ãƒ‡ãƒ«ã‚’実行ã—ã€ãã‚Œãžã‚Œã®ãƒ¢ãƒ‡ãƒ«ã§æ•¸ç™¾è¬ã®ãƒ‘ラメータを処ç†ã—ã¾ã™ã€‚アプリケーションã®å¿œç”性ãŒé«˜ã„ã¨æ„Ÿã˜ã‚‰ã‚Œã‚‹ã‚ˆã†ã«ã™ã‚‹ã«ã¯ã€ã“ã®ãƒ‘イプラインを 300 ミリ秒未満ã§å®Œäº†ã™ã‚‹å¿…è¦ãŒã‚ã‚Šã€å„モデルã«éžå¸¸ã«åŽ³ã—ã„レイテンシè¦ä»¶ãŒèª²ã•ã‚Œã¾ã™ã€‚高性能ã®æœ€é©åŒ–㨠低精度ã®æŽ¨è«– (FP16 ã‚„ INT8) を用ã„ã‚‹ã¨ã€GPU ã§ã¯ä»–ã®ãƒ—ラットフォームよりも 大幅ã«é«˜ã„パフォーマンスを得るã“ã¨ãŒã§ãã¾ã™ã€‚
最新㮠GPU 性能ã¯ã€ãƒ‡ã‚£ãƒ¼ãƒ—ラーニング推論パフォーマンスã®ãƒšãƒ¼ã‚¸ã§ã„ã¤ã§ã‚‚ã”確èªã„ãŸã ã‘ã¾ã™ã€‚
TensorRT を用ã„㟠CNN ã§ã®æŽ¨è«–ç•«åƒåˆ†é¡ž
ResNet-50 v1.5 ã®ã‚¹ãƒ«ãƒ¼ãƒ—ット
DGX-1: NVIDIA V100-SXM2-16GB x 1ã€E5-2698 v4 2.2 GHz | TensorRT 6.0 | ãƒãƒƒãƒ サイズ = 128 | 19.12-py3 | 精度: æ··åˆ | データセット: Synthetic
Supermicro SYS-4029GP-TRT T4: NVIDIA T4 x 1ã€Gold 6240 2.6 GHz | TensorRT 6.0 | ãƒãƒƒãƒ サイズ = 128 | 19.12-py3 | 精度: INT8 | データセット: Synthetic
?
?
ResNet-50 v1.5 ã®ãƒ¬ã‚¤ãƒ†ãƒ³ã‚·
DGX-2: NVIDIA V100-SXM3-32GB x 1ã€Xeon Platinum 8168 2.7 GHz | TensorRT 6.0 | ãƒãƒƒãƒ サイズ = 1 | 19.12-py3 | 精度: INT8 | データセット: Synthetic
Supermicro SYS-4029GP-TRT T4: NVIDIA T4 x 1ã€Gold 6240 2.6 GHz | TensorRT 6.0 | ãƒãƒƒãƒ サイズ = 1 | 19.12-py3 | 精度: INT8 | データセット: Synthetic

NVIDIA TensorRT ã¯ã€é«˜æ€§èƒ½ãƒ‡ã‚£ãƒ¼ãƒ—ラーニング推論用 SDK ã§ã™ã€‚ディープラーニング推論å‘ã‘ã®ã‚ªãƒ—ティマイザーã¨ãƒ©ãƒ³ã‚¿ã‚¤ãƒ ãŒå«ã¾ã‚Œã¦ãŠã‚Šã€ãƒ‡ã‚£ãƒ¼ãƒ—ラーニング推論アプリケーションã«ãŠã‘る低レイテンシã€é«˜ã‚¹ãƒ«ãƒ¼ãƒ—ットを実ç¾ã—ã¾ã™ã€‚
詳細を見る
DeepStream SDK ã¯ã€ãƒžãƒ«ãƒã‚»ãƒ³ã‚µãƒ¼å‡¦ç†ã€AI ベースã®æ˜ åƒãŠã‚ˆã³ç•«åƒç†è§£ã®ãŸã‚ã®åŒ…括的ãªã‚¹ãƒˆãƒªãƒ¼ãƒŸãƒ³ã‚°åˆ†æžãƒ„ールã‚ットã§ã™ã€‚
詳細を見る

NVIDIA Triton Inference Server ã¯ã‚ªãƒ¼ãƒ—ン ソースã®æŽ¨è«–ソフトウェアã§ã€GPU 使用率を最大化ã™ã‚‹ DL モデルをæä¾›ã—ã¾ã™ã€‚Kubernetes ã¨çµ±åˆã•ã‚Œã¦ãŠã‚Šã€ã‚ªãƒ¼ã‚±ã‚¹ãƒˆãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ã€ãƒ¡ãƒˆãƒªã‚¯ã‚¹åŽé›†ã€è‡ªå‹•ã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°ãŒå¯èƒ½ã§ã™ã€‚
詳細を見る

NVIDIA Riva ã¯ã€è¦–覚ã€éŸ³è²ã€ãã®ä»–ã®ã‚»ãƒ³ã‚µãƒ¼ã‚’èžåˆã—㟠AI アプリケーションã®æ§‹ç¯‰ã¨å±•é–‹ã®ãŸã‚ã® SDK ã§ã™ã€‚ジェスãƒãƒ£ãƒ¼ã‚„視線ãªã©ã®è¦–覚的ãªæ‰‹ãŒã‹ã‚Šã‚’コンテã‚スト內ã®éŸ³è²ã¨å…±ã«ä½¿ç”¨ã§ãã‚‹ GPU アクセラレーション AI システムを構築ã€ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã€å±•é–‹ã™ã‚‹ãŸã‚ã®å®Œå…¨ãªãƒ¯ãƒ¼ã‚¯ãƒ•ãƒãƒ¼ã‚’æä¾›ã—ã¾ã™ã€‚
詳細を見るNGC ã‚«ã‚¿ãƒã‚°ã®å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã¨ DL ソフトウェア
The NVIDIA? NGC? ã‚«ã‚¿ãƒã‚°ã¯ã€ã‚£ãƒ¼ãƒ—ラーニングã¨æ©Ÿæ¢°å¸ç¿’ã®ãŸã‚ã® GPU 最é©åŒ–ソフトウェアã®ãƒãƒ–ã§ã™ã€‚AI ソフトウェアã¯æ¯Žæœˆæ›´æ–°ã•ã‚Œã€ãƒ¯ãƒ¼ã‚¯ã‚¹ãƒ†ãƒ¼ã‚·ãƒ§ãƒ³ã€ã‚ªãƒ³ãƒ—レミス サーãƒãƒ¼ã€ã‚¨ãƒƒã‚¸ã€ã‚¯ãƒ©ã‚¦ãƒ‰ä¸Šã® GPU æ載システムã«ç°¡å˜ã«å±•é–‹ã§ãるコンテナーを通ã˜ã¦æä¾›ã•ã‚Œã¾ã™ã€‚å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã¨ãƒ¢ãƒ‡ãƒ« スクリプトもæƒã£ã¦ãŠã‚Šã€é–‹ç™ºè€…ã¯è‡ªã‚‰ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§ç¨è‡ªã®ãƒ¢ãƒ‡ãƒ«ã‚’ã™ã°ã‚„ã構築ã§ãã¾ã™ã€‚ã•ã‚‰ã«ã€æ¥ç•Œå›ºæœ‰ã®ãƒ‹ãƒ¼ã‚ºã«å¯¾å¿œã™ã‚‹ AI ソリューションを構築ã™ã‚‹ãŸã‚ã® SDK ã¨ã€ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã®å±•é–‹ã‚’容易ã«ã™ã‚‹ Helm レジストリも用æ„ã•ã‚Œã¦ãŠã‚Šã€è¨ˆç®—時間をçŸç¸®ã§ãã¾ã™ã€‚
NGC? ã‚«ã‚¿ãƒã‚°ã®ç›®çš„ã¯ã€AI ソフトウェアã¸ã®ã‚¢ã‚¯ã‚»ã‚¹ã‚’容易ã«ã—ã¦ã€ãƒ‡ãƒ¼ã‚¿ サイエンティストや開発者㌠AI ソリューションã®æ§‹ç¯‰ã«é›†ä¸ã§ãるよã†ã«ã™ã‚‹ã“ã¨ã§ã™ã€‚

TensorFlowã€PyTorchã€TensorRT ãªã©ã® DL ソフトウェア コンテナーã¯ã€ãƒ‘フォーマンスå‘上ã®ãŸã‚ã«åŠ¹çŽ‡çš„ãªãƒ©ã‚¤ãƒ–ラリã§å¸¸æ™‚æ›´æ–°ã•ã‚Œã¦ãŠã‚Šã€ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã¯æ¯Žæœˆãƒªãƒªãƒ¼ã‚¹ã•ã‚Œã¾ã™ã€‚ã“ã‚Œã«ã‚ˆã‚Šã€ãƒ¦ãƒ¼ã‚¶ãƒ¼ã¯æœ€æ–°ãƒãƒ¼ã‚¸ãƒ§ãƒ³ã®ã‚³ãƒ³ãƒ†ãƒŠãƒ¼ã‚’プルã™ã‚‹ã ã‘ã§ã€åŒã˜ãƒãƒ¼ãƒ‰ã‚¦ã‚§ã‚¢ã§ã•ã‚‰ã«é«˜é€Ÿãªãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°æ€§èƒ½ã¨æŽ¨è«–性能を得られã¾ã™ã€‚ソフトウェアã¯ã‚·ãƒ³ã‚°ãƒ«ãŠã‚ˆã³ãƒžãƒ«ãƒ GPU システムã€ãƒ¯ãƒ¼ã‚¯ã‚¹ãƒ†ãƒ¼ã‚·ãƒ§ãƒ³ã€ã‚µãƒ¼ãƒãƒ¼ã€ã‚¯ãƒ©ã‚¦ãƒ‰ インスタンスã§ãƒ†ã‚¹ãƒˆã•ã‚Œã¦ãŠã‚Šã€ã‚らゆるコンピューティング プラットフォームã§ä¸€è²«ã—ãŸã‚¨ã‚¯ã‚¹ãƒšãƒªã‚¨ãƒ³ã‚¹ã‚’æä¾›ã—ã¾ã™ã€‚
詳細を見る
NVIDIA? NGC? ã‚«ã‚¿ãƒã‚°ã§ã¯ã€éŸ³è²èªã¿ä¸Šã’ã€è‡ªå‹•éŸ³è²èªè˜ã€è‡ªç„¶è¨€èªžå‡¦ç†ãªã©ã€ä¸€èˆ¬çš„㪠AI アプリケーションå‘ã‘ã®å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã‚’æä¾›ã—ã¦ã„ã¾ã™ã€‚NVIDIA? NGC? ã‚«ã‚¿ãƒã‚°ã®ãƒ¢ãƒ‡ãƒ«ã‚’ユーザーç¨è‡ªã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§å†ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã™ã‚Œã°ã€ã‚¼ãƒã‹ã‚‰å§‹ã‚ã‚‹ã‚ˆã‚Šã‚‚æ ¼æ®µã«é€Ÿãモデルを構築ã§ãã€è²´é‡ãªæ™‚間を節約ã§ãã¾ã™ã€‚ã•ã‚‰ã«ã€å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã¯ç²¾åº¦ãŒé«˜ãã€MLPerf ベンãƒãƒžãƒ¼ã‚¯ã§ã‚‚優れãŸã‚¹ã‚³ã‚¢ã‚’ç²å¾—ã—ã¦ã„ã¾ã™ã€‚カスタムã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§å¾®èª¿æ•´ã™ã‚‹ã“ã¨ã«ã‚ˆã‚Šã€æ¯”é¡žãªã„性能ã¨ç²¾åº¦ã‚’実ç¾ã™ã‚‹ã“ã¨ãŒå¯èƒ½ã§ã™
詳細を見る

NVIDIA? NGC? ã‚«ã‚¿ãƒã‚°ã§ã¯ã€ãƒ‡ã‚£ãƒ¼ãƒ—ラーニング モデル作æˆã®æ‰‹é †ã¨ã‚¹ã‚¯ãƒªãƒ—トã®ã»ã‹ã€çµæžœã‚’比較ã§ãるよã†ã«æ€§èƒ½ã¨ç²¾åº¦ã®ã‚µãƒ³ãƒ—ル指標もæä¾›ã—ã¦ã„ã¾ã™ã€‚ã“れらã®ã‚¹ã‚¯ãƒªãƒ—トã¯ã€ç„¡é§„ã®ãªã„高精度ã®ãƒ¢ãƒ‡ãƒ«ã‚’構築ã™ã‚‹ãŸã‚ã®ãƒ™ã‚¹ãƒˆ プラクティスを活用ã—ã¤ã¤ã€é«˜ã„柔軟性も備ãˆã¦ã„ã‚‹ãŸã‚ã€ãƒ¦ãƒ¼ã‚¹ ケースã«åˆã‚ã›ã¦ãƒ¢ãƒ‡ãƒ«ã‚’自在ã«ã‚«ã‚¹ã‚¿ãƒžã‚¤ã‚ºã§ãã¾ã™ã€‚
詳細を見る
開発者/DevOps å‘ã‘ツール
NVIDIA ã®é–‹ç™ºè€…å‘ã‘ツールã¯ãƒ‡ã‚¹ã‚¯ãƒˆãƒƒãƒ—やエッジ環境ã§å‹•ä½œã—ã€ãƒ‡ã‚£ãƒ¼ãƒ—ラーニングã€æ©Ÿæ¢°å¸ç¿’ã€HPC アプリケーションã«ãŠã‘る複雑㪠CPU 㨠GPU ã®åˆ©ç”¨ã«é–¢ã™ã‚‹ç¨è‡ªã®ã‚¤ãƒ³ã‚µã‚¤ãƒˆã‚’æä¾›ã—ã¾ã™ã€‚ã“ã‚Œã«ã‚ˆã‚Šã€é–‹ç™ºè€…ã¯ã‚¢ãƒ—リケーションã®æ§‹ç¯‰ã€ãƒ‡ãƒãƒƒã‚°ã€ãƒ—ãƒãƒ•ã‚¡ã‚¤ãƒªãƒ³ã‚°ã€ãƒ‘フォーマンスã®æœ€é©åŒ–を効果的ã«è¡Œãˆã¾ã™ã€‚Kubernetes on NVIDIA GPU を使用ã™ã‚Œã°ã€ä¼æ¥ã¯ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã‚„推論ã®å±•é–‹ç’°å¢ƒã‚’マルムGPU クラスターã«ã‚·ãƒ¼ãƒ レスã«æ‹¡å¼µã§ãã¾ã™ã€‚
Nsight Systems ã¯ã€ã‚¢ãƒ—リケーションã®ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã‚’å¯è¦–化ã™ã‚‹ãŸã‚ã«è¨è¨ˆã•ã‚ŒãŸã€ã‚·ã‚¹ãƒ†ãƒ 全體を対象ã¨ã—ãŸãƒ‘フォーマンス分æžãƒ„ールã§ã™ã€‚最大é™ã®æœ€é©åŒ–ãŒå¯èƒ½ãªéƒ¨åˆ†ã‚’特定ã—ã€CPU ã‚„ GPU ã®æ•¸ã‚„è¦æ¨¡ã«é–¢ä¿‚ãªãスケーリングを効率的ã«èª¿æ•´ã§ãã¾ã™ã€‚
DLProf (Deep Learning Profiler) ã¯ã€GPU ã®ä½¿ç”¨çŽ‡ã€Tensor コアã§ã‚µãƒãƒ¼ãƒˆã•ã‚Œã¦ã„ã‚‹æ“作ã€å®Ÿè¡Œä¸ã® Tensor コアã®ä½¿ç”¨ç‹€æ³ã‚’å¯è¦–化ã™ã‚‹ãƒ—ãƒãƒ•ã‚¡ã‚¤ãƒªãƒ³ã‚° ツールã§ã™ã€‚
Kubernetes on NVIDIA GPU を利用ã™ã‚‹ã¨ã€ä¼æ¥ã¯ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã¨æŽ¨è«–ã®å±•é–‹ç’°å¢ƒã‚’マルãƒã‚¯ãƒ©ã‚¦ãƒ‰ GPU クラスターã«ã‚·ãƒ¼ãƒ レスã«ã‚¹ã‚±ãƒ¼ãƒ«ã‚¢ãƒƒãƒ—ã§ãã¾ã™ã€‚開発者ã¯ã€GPU アクセラレーション アプリケーションをä¾å˜é–¢ä¿‚ã¨ä¸€ç·’ã« 1 ã¤ã®ãƒ‘ッケージã«ã¾ã¨ã‚ã€Kubernetes ã§å±•é–‹ã—ã€å±•é–‹ç’°å¢ƒã‚’å•ã‚ãš NVIDIA GPU 上ã§æœ€é«˜ã®ãƒ‘フォーマンスを実ç¾ã§ãã¾ã™ã€‚
Nsight Compute ã¯ã€CUDA を使用ã—ã¦ç›´æŽ¥æ§‹ç¯‰ã•ã‚ŒãŸãƒ‡ã‚£ãƒ¼ãƒ—ラーニング アプリケーションã®ãŸã‚ã®ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ãƒ†ã‚£ãƒ–ãªã‚«ãƒ¼ãƒãƒ« プãƒãƒ•ã‚¡ã‚¤ãƒ©ã§ã™ã€‚GUI ã¾ãŸã¯ã‚³ãƒžãƒ³ãƒ‰ ライン インターフェイスã‹ã‚‰ã€è©³ç´°ãªãƒ‘フォーマンス指標を確èªã—ãŸã‚Šã€API ã®ãƒ‡ãƒãƒƒã‚°ã‚’è¡Œã£ãŸã‚Šã§ãã¾ã™ã€‚ã¾ãŸã€Nsight Compute ã®ãƒ‡ãƒ¼ã‚¿é§†å‹•åž‹ã®ãƒ¦ãƒ¼ã‚¶ãƒ¼ インターフェイスã¯ã‚«ã‚¹ã‚¿ãƒžã‚¤ã‚ºå¯èƒ½ã§ã€æä¾›ã•ã‚Œã‚‹æŒ‡æ¨™ã‚³ãƒ¬ã‚¯ã‚·ãƒ§ãƒ³ã¯ã€çµæžœã®å¾Œå‡¦ç†ç”¨ã®åˆ†æžã‚¹ã‚¯ãƒªãƒ—トã§æ‹¡å¼µå¯èƒ½ã§ã™ã€‚
FME (Feature Map Explorer) を使用ã™ã‚‹ã¨ã€ä½Žãƒ¬ãƒ™ãƒ«ã®ãƒãƒ£ãƒãƒ«è¦–覚化やã€ç‰¹å¾´ãƒžãƒƒãƒ—ã®å®Œå…¨ãªãƒ†ãƒ³ã‚½ãƒ«ãŠã‚ˆã³å„ãƒãƒ£ãƒãƒ« スライスã«é–¢ã™ã‚‹è©³ç´°ãªæ•¸å€¤æƒ…å ±ãªã©ã€ã•ã¾ã–ã¾ãªãƒ“ュー㧠4 次元ã®ç•«åƒãƒ™ãƒ¼ã‚¹ã®ç‰¹å¾´ãƒžãƒƒãƒ— データを視覚化ã§ãã¾ã™ã€‚