NVIDIA のコンピューター ビジョン

周辺環境を視覚的に認識、理解できるデバイスを実現するためには、スケーラブルで検証済みの卓越した性能のソフトウェアが必要です。




NVIDIA のソフトウェアは、モデルの開発から展開までを行う、個人開発者、高等教育機関、研究機関、企業をサポートし、エンドツーエンドのコンピューター ビジョン ワークフローを実現します。

コンピューター ビジョンとは、スマート カメラなどのデバイスで畫像や映像を取得、処理、分析、解釈できるようにするテクノロジ分野です。たとえば、コンピューター ビジョン アルゴリズムを採用した運転支援システムでは、カメラやその他のセンサーを使用して、自動車の前後の畫像を表示するだけでなく、そこに何があるのかを認識し、畫像フレーム內の注目すべき領域や地點を特定して分類します。このように、コンピューター ビジョンが安全を擔保することで、運転中に路上の障害物、他の車両、動物、人間を回避できるようになります。これに似た例として、一部の農家では、収穫量を増やすために、コンピューター ビジョン対応デバイスを利用して、広大な畑の中から自動的に雑草を識別したり、生育の良い作物などを特定したりしています。こうした今日のコンピューター ビジョンのタスクには、人工知能、具體的には人間の脳を模した機械學習の一種であるディープラーニングが用いられています。ディープラーニングを用いたコンピューター ビジョン モデルは、人間の専門家が必要とするよりもはるかに少ないインプットで同じレベルに適応し、デバイスのパフォーマンスを上げられるようになります。







コンピューター ビジョンの手法

ほとんどのコンピューター ビジョン手法では、まず、特定のタスク専用に大量のデータでトレーニングしたモデル (數學的アルゴリズム) を使用します。以下のような手法が一般的です。



Computer Vision classification

分類

分類とは、畫像または映像のフレーム內の物體を判斷して分類することを指します。分類モデルは通常、大規模なデータセットを使用してトレーニングされ、犬、貓、いすなどの基本的な物體の識別や、路上に寫っている車両の種類といったごく具體的な物體の識別を行います。分類出力の品質は、使用するトレーニング データに左右され、トレーニング データは、量が多く多様であるほど、精度が向上します。

Computer Vision detection

検出

検出とは、畫像または映像のフレーム內の 1 つまたは複數の物體の位置を特定することを指します。検出した物體の周囲に、アルゴリズムが長方形のバウンディング ボックスを出力して、畫像內の位置を示します。物體検出器をトレーニングすることで、自動車、道路標識、人間、その他の物體などを検出できるようになります。

Computer Vision segmentation

セグメンテーション

セグメンテーションとは、畫像內のすべてのピクセルにラベルを割り當て、畫像內の物體や関心領域の位置を正確に特定することを指します。これにより、ラベルが同じピクセルは、特性 (色やテクスチャなど) が類似します。セグメンテーション モデルは、MRI スキャンで腫瘍を自動的に検出するなど、醫療畫像処理に非常によく使用されます。

Image Synthesis

畫像合成

畫像合成とは、特定の物體やコンテンツを含む畫像を作成または人工的に生成することを指します。一般的に、こうした畫像や映像フレームの合成には、ニューラル ネットワークの一種である GAN (敵対的生成ネットワーク) が使用されます。畫像合成の主な目的は、テキストからの畫像生成で、GAN を使用してテキストの説明に基づいて畫像を生成します。





NVIDIA の學習済みモデルでコンピューター
ビジョンを開発する


このようなモデルを自力で開発する場合、膨大な量のトレーニング データ、時間、専門知識が必要になります。しかし、幸いなことに、エキスパートでなくても始められる方法があります。NVIDIA では、獨自のコンピューター ビジョン ソリューションの開発を始められる、事前に構築済みですぐに使える學習済みモデルを多數用意しています。まずは、GPU アクセラレーション ソフトウェア ハブの NGC にアクセスし、コンピューター ビジョンのモデルやリソース、その他のディープラーニングを用いた音聲および自然言語処理のユース ケースやアプリケーション フレームワークをご確認ください。


NGC カタログの學習済みモデルを確認する






エンドツーエンドのコンピューター ビジョン
ワークフローを開発

NVIDIA の學習済みモデル、TAO、DeepStream を使用して、手軽にエンドツーエンドのコンピューター ビジョン AI 開発プロセスを始めましょう。



NVIDIA metropolis

AI モデル適応プラットフォーム

NVIDIA TAO

ユーザー インターフェイス ベースのガイド付きワークフロー ソリューションにより、実運用レベルの高精度なコンピューター ビジョンと対話型 AI モデルを作成します。

詳細を見る
NVIDIA metropolis

ストリーミング分析ツールキット

NVIDIA Deepstream SDK

マルチセンサー処理、映像、音聲、畫像理解用のリアルタイム ビジョン AI アプリケーションを構築します。



詳細を見る
NVIDIA translation screenshot

スマート インフラストラクチャとスマート シティ

NVIDIA Metropolis

エンドツーエンドの映像ベースの分析プラットフォームを構築するか、業界エコシステムのパートナー プラットフォームを使用します。



詳細を見る


各種 NVIDIA ソフトウェアのコンピューター ビジョン

NVIDIA の業界別ソフトウェア製品およびプラットフォームを使用して、コンピューター ビジョン アプリケーションを開発する方法をご紹介します。

NVIDIA clara guardian

醫療

Clara

ジェスチャ認識、心拍數監視、マスク検出、病室での転倒を検知するための姿勢推定用のコンピューター ビジョン モデルを開発します。醫療畫像処理、醫療デバイスとストリーミング ビデオ、スマート ホスピタルのワークフローを構築、管理、展開します。

詳細を見る

自動運転

DRIVE

自動運転車 (AV) やインテリジェント コックピット (IX) 用のエンドツーエンド (E2E) のコンピューター ビジョン ソリューションを開発します。コンピューター ビジョン データの収集と生成、E2E シミュレーション プラットフォーム (DRIVE Sim) を使用した DNN モデルのトレーニングを行います。

詳細を見る
NVIDIA translation screenshot

ビデオ ストリーミング

Maxine SDK

ビデオ エフェクト、オーディオ エフェクト、拡張現実を使用した、バーチャルでのコラボレーションおよびコンテンツ作成アプリケーションを作成します。

詳細を見る
NVIDIA riva

マルチモーダル対話

Riva

視覚、音聲、その他のセンサー入力を同時に融合するマルチモーダルの対話型 AI アプリケーションを開発します。

詳細を見る

次世代のコンピューター ビジョンの構想

NVIDIA のコンピューター ビジョンに関する新たなテクノロジと革新的な研究をご紹介します。

研究

新たなイノベーション


NVIDIA のコンピューター ビジョン リサーチ エンジニアとデータ サイエンティストが解決してきた問題について、最新の研究発表をご覧ください。


詳細を見る
Computer Vision Research Engineers

ロボティクス

NVIDIA Isaac Sim


仮想環境でロボットを開発、テスト、トレーニング、管理します。コンピューター ビジョンを使用して、操作、ナビゲーション、合成データの生成を行います。


詳細を見る


NVIDIA の GPU アクセラレーション ライブラリと最適化プラットフォーム

NVIDIA のライブラリと最適化プラットフォームによって、GPU 上のコンピューター ビジョンを高速化する方法をご紹介します。

data loading library

データ パイプライン アクセラレータ

Data Loading Library (DALI)

GPU を使用して、コンピューター ビジョンおよび音聲データの読み込みと処理を行います。TensorFlow、PyTorch、MXNet、PaddlePaddle モデルで直接使用できます。

詳細を見る

3D ディープラーニング研究ライブラリ

NVIDIA KAOLIN Library

合成データを生成します。3D トレーニング データセットをレンダリングして視覚化します。



詳細を見る
NVIDIA translation screenshot

畫像およびシグナル処理ライブラリ

NVIDIA Performance Primitives (NPP)

すぐに使用できる分野別かつ高性能の畫像、映像、シグナル処理用関數を展開します。

詳細を見る

組み込みコンピューター ビジョンおよび畫像処理ライブラリ

Vision Programming Interface (VPI)

非同期のコンピューター ビジョンおよび畫像処理アプリケーションをリアルタイムで実裝します。

詳細を見る
nvJPEG and nvJPEG2000

畫像デコード ライブラリ

nvJPEG と nvJPEG2000

JPEG および JPEG2000 畫像の処理を高速化します。




詳細を見る
NVIDIA Optical Flow SDK

モーション フロー生成

Optical Flow SDK

GPU を使用してフレーム間のフロー ベクトル計算を強化することで、動畫ストリーム內の物體や動作を認識、分類、追跡します。



詳細を見る
NVIDIA Tensor RT

推論最適化およびランタイム

TensorRT

推論アプリケーションで低レイテンシと高スループットを実現します。




詳細を見る

世界を支える NVIDIA のコンピューター ビジョン

よく寄せられる質問を確認する

コンピューター ビジョンは、今や研究開発にとどまらず、人々の生活を変える実用的なソリューションに活用されています。人工知能とハイパフォーマンス コンピューティングに関する NVIDIA の高度な専門知識は、世界にさまざまな可能性を生み出しています。


詳細を見る
Get started with Frequently Asked Questions
Learn the Fundamentals of Deep Learning

コンピューター ビジョンの基礎を學ぶ

コンピューター ビジョンに馴染みがなければ、始める前に基礎を學びましょう。Deep Learning Institute のコースをお勧めします。これは 8 時間のコースで、ディープラーニングの基礎を學び、コンピューター ビジョンの実踐演習を行います。ディープラーニング モデルを一からトレーニングする方法、學習済みモデルを使用する方法、各種モデル アーキテクチャをテストする方法、ディープラーニングのツールや手法、データセットを使用してモデルの精度を向上させる方法などを學びます。さらに、コースの修了後には認定資格を取得できます。


すぐに參加する

コンピューター ビジョンの最新情報


コンピューター ビジョンの実用例

さまざまな規模の企業が、コンピューター ビジョンの課題に取り組んでいます。スタートアップ企業から世界的メーカーまで、革新的なソリューションの実例をご紹介します。

ロー ビジョン (低視力) の人々の移動をサポート (Biel Glasses)

コンピューター ビジョンと AI によって製品の品質を向上 (Audi)

Maximo Visual Inspection を使用した NGC モデルの展開 (IBM)

コンピューター ビジョンの課題を解決

皆様が直面している課題について、ぜひお聞かせください。コンピューター ビジョンを利用して、どのような問題を解決したいとお考えですか?

成功に向けたパートナーシップ

世界規模で取り組むには、コミュニティの力が必要です。さまざまなニーズに応える優れたソリューションが、お客様の課題を解決いたします。

Airmeet
BMW logo
Kings College London
Microsoft
Miovision
Notch
Ping An
Quantiphi logo
Smartcow
T-Mobile
Touchcast logo
Verizon logo

コンピューター ビジョン ソリューションの世界を支える NVIDIA

參加する