2. ã•ã¾ã–ã¾ãªã‚¿ã‚¤ãƒ—ã®ã‚«ãƒ¡ãƒ©ã¸ã®é©å¿œ
TAO Toolkit を使用ã™ã‚‹ã¨ã€å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã‚’æ–°ã—ã„ドメインã€ç’°å¢ƒã€ã‚»ãƒ³ã‚µãƒ¼ã«ç°¡å˜ã«é©å¿œã•ã›ã‚‹ã“ã¨ãŒã§ãã¾ã™2.1 カメラ利用時ã®èª²é¡Œ
ã©ã®ã‚³ãƒ³ãƒ”ューター ビジョン アプリケーションã«ã‚‚ã€å‘¨å›²ã®ä¸–界を感知ã™ã‚‹ AI モデルãŒå¿…è¦ã§ã™ã€‚ãã®ãŸã‚ã«æœ€ã‚‚よã使用ã•ã‚Œã‚‹ã‚»ãƒ³ã‚µãƒ¼ãŒã€ã‚«ãƒ¡ãƒ©ã§ã™ã€‚カメラを使用ã™ã‚‹ã“ã¨ã§ã€AI モデルã¯è¦–覚的ãªæƒ…å ±ã‚’å…¥åŠ›ã¨ã—ã¦å—ã‘å–ã‚Šã€ã‚ªãƒ–ジェクトã®åˆ†é¡žã€æ¤œå‡ºã€è¿½è·¡ãªã©ã®ã‚¿ã‚¹ã‚¯ã‚’実行ã§ãã¾ã™ã€‚
カメラを使用ã™ã‚‹ AI モデルをç¾å ´ã«å±•é–‹ã™ã‚‹å ´åˆã€ç’°å¢ƒçš„è¦å› や技術的è¦å› ã§å¤‰åŒ–ã™ã‚‹ã•ã¾ã–ã¾ãªæ¢ä»¶ã«å¯¾å¿œã—ã¦ãã¡ã‚“ã¨æ©Ÿèƒ½ã™ã‚‹ã“ã¨ãŒæ±‚ã‚られã¾ã™ã€‚カメラã®ã‚¿ã‚¤ãƒ—ã‚„è¨ç½®å ´æ‰€ã«ã‚ˆã£ã¦ã¯ã€ç•«åƒã®æªã¿ã€è‰²ãšã‚Œã€è¼åº¦ãƒ¬ãƒ™ãƒ«ã®å¤‰åŒ–ãªã©ãŒç™ºç”Ÿã—ã¾ã™ã€‚ç¾å ´ã¸é€Ÿã‚„ã‹ã«å±•é–‹ã™ã‚‹ãŸã‚ã«ã¯ã€ç‰¹å®šã®ç’°å¢ƒä¸‹ã§å‹•ä½œã™ã‚‹ã‚ˆã†ãƒ¢ãƒ‡ãƒ«ã‚’カスタマイズã—ã¦ã€ã“ã†ã—ãŸè¦å› ã‚„ãã®ä»–ã•ã¾ã–ã¾ãªåˆ¶ç´„ã«å¯¾å‡¦ã™ã‚‹ã“ã¨ãŒæ¬ ã‹ã›ã¾ã›ã‚“。
ãŸã¨ãˆã°ã€èµ¤å¤–ç·š (IR) カメラやサーマル カメラã¯ã€å¯è¦–光スペクトルãŒä½¿ã‚ã‚Œã¦ã„ãªã„ãŸã‚ã€ä½Žç…§åº¦ç’°å¢ƒã§ã®æ’®å½±ã«éžå¸¸ã«æœ‰åŠ¹ã§ã™ã€‚ãŸã ã—ã€IR カメラã¯æš—é—‡ã§ã‚‚機能ã—ã¾ã™ãŒã€ãã®ç•«åƒå‡ºåŠ›ã«ã¯ã‚«ãƒ©ãƒ¼ データãŒãªãã€ä½Žè§£åƒåº¦ã§ã‚ã‚‹ã“ã¨ãŒå¤šãã€ã‚ªãƒ–ジェクト間ã®å¢ƒç•Œã‚‚ã¯ã£ãã‚Šã—ã¾ã›ã‚“。ã“ã®ãŸã‚ã€IR ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã«å¯¾ã—ã¦ã€é€šå¸¸ã® RGB ç•«åƒã§ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã•ã‚ŒãŸ AI モデルを用ã„よã†ã¨ã™ã‚‹ã¨ã€å¤šãã®èª²é¡ŒãŒå‡ºã¦ãã¾ã™ã€‚ã—ã‹ã—ã€NVIDIA ã®å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã‚’利用ã™ã‚Œã°ã€ã‚«ãƒ¡ãƒ©ã®ã‚¿ã‚¤ãƒ—や環境的ãªæ¢ä»¶ãŒç•°ãªã£ã¦ã„ã¦ã‚‚ã€ãƒ‡ãƒ¼ã‚¿ã®å‰Šæ¸›ã¨å¸ç¿’時間ã®çŸç¸®ãŒå¯èƒ½ã§ã™ã€‚

2.2 解決ç–
AI ã‚„ HPC ã®ãŸã‚ã® GPU 最é©åŒ–ソフトウェアã®ãƒãƒ–ã§ã‚ã‚‹ NGC ã‚«ã‚¿ãƒã‚°ã¯ã€ç‰¹å®šã®ç’°å¢ƒæ¢ä»¶ã«åˆã‚ã›ãŸå¾®èª¿æ•´ã®åœŸè‡ºã¨ã—ã¦æœ€é©ãªã€é‹ç”¨å“質ã®å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã‚’æä¾›ã—ã¦ã„ã¾ã™ã€‚å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã¯ã€ã‚らã‹ã˜ã‚代表的ãªãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã•ã‚Œã¦ãŠã‚Šã€é‡ã¿ä»˜ã‘ã¨ãƒã‚¤ã‚¢ã‚¹ã«ã‚ˆã£ã¦èª¿æ•´ã•ã‚Œã¦ã„ã¾ã™ã€‚カスタムデータã§ç°¡å˜ã«å†ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã§ãã€ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã«è¦ã™ã‚‹æ™‚é–“ã¯ã€ã‚¼ãƒã‹ã‚‰è¡Œã†å ´åˆã«æ¯”ã¹ã¦ã‚ãšã‹ã§æ¸ˆã¿ã¾ã™ã€‚
ãŸã¨ãˆã°ã€PeopleNet ã¯ã€100 è¬æžšã‚’超ãˆã‚‹ç•«åƒã§ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã•ã‚ŒãŸå¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã§ã€å‘¨å›²ãŒæ··é›‘ã—ã¦ã„ã‚‹å ´åˆã‚„ã€éƒ¨åˆ†çš„ã«éš ã‚Œã¦ã„ã‚‹å ´åˆã€è§£åƒåº¦ãŒä½Žã„å ´åˆã§ã‚‚人物ã®æ¤œå‡ºãŒå¯èƒ½ã§ã™ã€‚

NVIDIA PeopleNet ã¯å±•é–‹ãŒå®¹æ˜“ã§ã€ä½•ã‚ˆã‚Šã€NVIDIA TAO Toolkit ã§å¾®èª¿æ•´ã—ã¦ã€ç•°ãªã‚‹ç’°å¢ƒã¸ã®é©å¿œãŒå¯èƒ½ã§ã™ã€‚ã“ã®ãƒ¢ãƒ‡ãƒ«ã¯ã€æ˜Žã‚‹ã„å ´æ‰€ã®ç•«åƒã§ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã•ã‚ŒãŸã‚‚ã®ã§ã‚ã‚‹ãŸã‚ã€ãã®ã¾ã¾ã§ã‚ã‚Œã°ã€ç†± IR カメラã®ç•«åƒã§ã¯ãƒ‘フォーマンスãŒä½Žä¸‹ã—ã¾ã™ã€‚TAO Toolkit を使用ã™ã‚Œã°ã€IR ç•«åƒã§ã†ã¾ã動作ã™ã‚‹ã‚ˆã†ã€ã™ã°ã‚„ãモデルをé©å¿œã•ã›ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚
2.3 çµè«–
ç•°ãªã‚‹ã‚¿ã‚¤ãƒ—ã®ã‚«ãƒ¡ãƒ©é–“ã§ã®è»¢ç§»å¸ç¿’ãŒæœ‰åŠ¹ã§ã‚ã‚‹ã“ã¨ã‚’示ã™ãŸã‚ã«ã€ã“ã®ãƒ¦ãƒ¼ã‚¹ ケースã§ã¯ã€ã‚¿ã‚¹ã‚¯ã¨ã—ã¦ã€NVIDIA ã®å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ« PeopleNet を熱 IR ç•«åƒã§å‹•ä½œã™ã‚‹ã‚ˆã†é©å¿œã•ã›ã¾ã™ã€‚ã¾ãŸã€å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã‚’使用ã™ã‚‹ã“ã¨ã§ã€å°‘é‡ã®ãƒ‡ãƒ¼ã‚¿ã§é«˜ã„精度ãŒé”æˆã§ãã‚‹ã“ã¨ã‚’示ã™ãŸã‚ã«ã€ã“ã®ã‚¿ã‚¹ã‚¯ã§ã¯ã€IR カメラã§æ’®å½±ã•ã‚ŒãŸã‚µã‚¤ã‚ºã®ç•°ãªã‚‹ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§ 2 パターンã®ãƒ¢ãƒ‡ãƒ«ã‚’トレーニングã—ã¾ã™ã€‚
ゼãƒã‹ã‚‰ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã—ãŸãƒ¢ãƒ‡ãƒ«ã®å ´åˆã€mAP (å¹³å‡é©åˆçŽ‡ã®å¹³å‡) ㌠77% ã«é”ã™ã‚‹ã¾ã§ã«ç´„ 6,300 æžšã®ç•«åƒãŒå¿…è¦ã§ã—ãŸã€‚ã—ã‹ã—ã€å¸ç¿’済ã¿ã®ãƒ¢ãƒ‡ãƒ« PeopleNet を土臺ã«ã—ã¦ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã—ãŸãƒ¢ãƒ‡ãƒ«ã®å ´åˆã€mAP ㌠78% を超ãˆã‚‹ã¾ã§ã«å¿…è¦ã¨ã—ãŸç•«åƒã¯ã‚ãšã‹ 2,500 æžšã§ã—ãŸã€‚ã“ã®ãƒ¦ãƒ¼ã‚¹ ケースã§ã¯ã€å¸ç¿’済ã¿ã® PeopleNet を使用ã™ã‚‹ã“ã¨ã§ã€ãƒ‡ãƒ¼ã‚¿ã‚’ 60% 削減ã—ã¦åŒç‰ã®ç²¾åº¦ã‚’é”æˆã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ã¤ã¾ã‚Šã€ç•«åƒã®åŽé›†ã¨ã‚¢ãƒŽãƒ†ãƒ¼ã‚·ãƒ§ãƒ³ã«ä½™è¨ˆãªæ™‚é–“ã‚’ã‹ã‘ã‚‹ã“ã¨ãªãã€å°‘ãªã„データセットã§é€Ÿã‚„ã‹ã«ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã§ãã‚‹ã¨ã„ã†ã“ã¨ã§ã™ã€‚
ã¾ãŸã€å¸ç¿’済ã¿ã® PeopleNet ã¯ã€6,300 æžšã®ç•«åƒã‹ã‚‰ãªã‚‹ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§ã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã«ãŠã„ã¦ã‚‚精度ãŒé«˜ãã€PeopleNet ãªã—ã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã‚ˆã‚Šã‚‚ 6% 高ㄠ83% ã® mAP を実ç¾ã—ã¦ã„ã¾ã™ã€‚å¸ç¿’済ã¿ã®ãƒ¢ãƒ‡ãƒ«ã¯ã€å¿…è¦ãªç•«åƒãŒã¯ã‚‹ã‹ã«å°‘ãªã„ã ã‘ã§ãªãã€æœªå¸ç¿’ã®ãƒ¢ãƒ‡ãƒ«ã‚’使用ã™ã‚‹å ´åˆä»¥ä¸Šã®ç²¾åº¦ãŒå¾—られã¾ã™ã€‚ã“ã®ã‚¿ã‚¹ã‚¯ã§ã¯ã€å¸ç¿’済ã¿ã®ãƒ¢ãƒ‡ãƒ«ã‚’使用ã™ã‚‹ã“ã¨ã§ã€ã‚ˆã‚Šå°‘ãªã„データセットã§é«˜ã„精度をé”æˆã—ã€ãƒ‡ãƒ¼ã‚¿ã®ãƒ©ãƒ™ãƒ«ä»˜ã‘やトレーニングã®ã‚³ã‚¹ãƒˆã‚’削減ã§ãã‚‹ã“ã¨ãŒç¤ºã•ã‚Œã¾ã—ãŸã€‚



ã“ã®ã‚¿ã‚¹ã‚¯ã¯ã€FLIR 赤外線データセットを用ã„ã¦å®Ÿè¡Œã—ã¾ã—ãŸã€‚ガイド付ãã®å®Œå…¨ãªã‚¿ã‚¹ã‚¯å®Ÿæ–½æ‰‹é †ã¯ã€TAO タスク GitHub リãƒã‚¸ãƒˆãƒªã§å…¥æ‰‹ã§ãã¾ã™ã€‚