3. å°‘é‡ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§ã®è¿…速ãªãƒ—ãƒãƒˆã‚¿ã‚¤ãƒ”ング
TAO Toolkit ãŒæä¾›ã™ã‚‹ãƒ‡ãƒ¼ã‚¿æ‹¡å¼µã®æ©Ÿèƒ½ã¨ã€NGC ã®å¸ç¿’済ã¿ãƒ¢ãƒ‡ãƒ«ã‚’併用ã™ã‚‹ã“ã¨ã§ã€ã‚ãšã‹ 100 æžšã®ç•«åƒã§è¿…速ã«ãƒ—ãƒãƒˆã‚¿ã‚¤ãƒ—を作æˆã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚3.1 データåŽé›†ã®èª²é¡Œ
AI アプリケーションã®é–‹ç™ºã«ãŠã„ã¦ç‰¹ã«ã‚³ã‚¹ãƒˆã¨æ™‚é–“ãŒã‹ã‹ã‚‹ã®ãŒã€ãƒ¢ãƒ‡ãƒ«ã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ç”¨ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®åŽé›†ã¨ã‚¢ãƒŽãƒ†ãƒ¼ã‚·ãƒ§ãƒ³ã§ã™ã€‚データãŒåŽé›†ã•ã‚Œã‚‹ã®ã‚’å¾…ã£ã¦ã„ã¦ã¯ã€é–‹ç™ºã‚¹ãƒ”ードã¯éˆåŒ–ã—ã¦ã—ã¾ã„ã¾ã™ã€‚ã¾ãŸã€ãƒ¢ãƒ‡ãƒ«ã®å¸ç¿’ã«è¬å…¨ã‚’期ã™ã«ã¯ã€å分ãªæ•¸ã¨ç¨®é¡žã®ç•«åƒãŒå¿…è¦ã§ã‚ã‚Šã€ã©ã¡ã‚‰ã‚‚ä¸è¶³ã—ã¦ã„るよã†ãªå°‘é‡ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§ã®ã¿ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã—ãŸãƒ¢ãƒ‡ãƒ«ã ã¨ã€ãƒ‘フォーマンスãŒä½Žä¸‹ã™ã‚‹å¯èƒ½æ€§ã‚‚ã‚ã‚Šã¾ã™ã€‚
ç‹€æ³ã«ã‚ˆã£ã¦ã¯ã€ãƒ¢ãƒ‡ãƒ«ã®å¸ç¿’ã«å分ãªç•«åƒã‚’åŽé›†ã§ããªã„ã“ã¨ã‚‚ã‚ã‚Šã¾ã™ã€‚ãŸã¨ãˆã°ã€ãƒ—リント基æ¿ã®çµ„ã¿ç«‹ã¦ãƒ©ã‚¤ãƒ³ã§æ¬ 陥を検出ã™ã‚‹å ´åˆã€ã“ã®æ¤œå‡ºã‚¿ã‚¹ã‚¯ã¯ã€å“質を確ä¿ã—ã€çµ„ã¿ç«‹ã¦ãƒ—ãƒã‚»ã‚¹ã®ã‚¨ãƒ©ãƒ¼ã‚’発見ã™ã‚‹ã†ãˆã§ã¨ã¦ã‚‚é‡è¦ã§ã™ã€‚ãŸã ã—ã€ãƒ—リント基æ¿ã®çµ„ã¿ç«‹ã¦ã§æ¬ 陥ãŒç™ºç”Ÿã™ã‚‹ç¢ºçŽ‡ã¯éžå¸¸ã«ä½Žã„ãŸã‚ã€å¸ç¿’ã«ã‚ˆã£ã¦ãƒ¢ãƒ‡ãƒ«ã®ç²¾åº¦ã‚’高ã‚ã‚‹ã®ã«å分ãªç•«åƒã‚’åŽé›†ã™ã‚‹ã«ã¯ã€æ•¸ã‹æœˆã€ã‚ã‚‹ã„ã¯æ•¸å¹´ã‹ã‹ã‚‹ã“ã¨ã‚‚考ãˆã‚‰ã‚Œã¾ã™ã€‚ã“ã®ã‚ˆã†ã«ã€ç•°å¸¸ã‚’検出ã—よã†ã¨ã™ã‚‹å ´åˆã«å分ãªãƒ‡ãƒ¼ã‚¿ã‚’åŽé›†ã™ã‚‹ã“ã¨ã¯ã€å¤šãã®æ¥ç•Œã§èª²é¡Œã¨ãªã£ã¦ã„ã¾ã™ã€‚
ã“ã®èª²é¡Œã‚’å…‹æœã™ã‚‹ã«ã¯ã€å°‘é‡ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã«å¯¾ã—ã¦ã€Œãƒ‡ãƒ¼ã‚¿æ‹¡å¼µã€ã¨å‘¼ã°ã‚Œã‚‹æ‰‹æ³•ã‚’用ã„ã€æ—¢å˜ã®ç•«åƒã‚’ベースã«ç¨®é¡žã‚„サイズを増やã—ã¾ã™ã€‚自å‰ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’æ‹¡å¼µã™ã‚‹ã“ã¨ã§ã€ãƒ¢ãƒ‡ãƒ«ã®ä¸€èˆ¬åŒ–ã‚’å¯èƒ½ã«ã™ã‚‹å¤‰å‹•æ€§ã¨ãƒ©ãƒ³ãƒ€ãƒ 性ãŒåŠ ã‚ã‚Šã€ã“ã‚Œã¾ã§è¦‹ãŸã“ã¨ã®ãªã„データã«å¯¾ã™ã‚‹ãƒ¢ãƒ‡ãƒ«ã®ç²¾åº¦ãŒå‘上ã—ã¾ã™ã€‚より多ãã®ãƒ‡ãƒ¼ã‚¿ã‚’åŽé›†ã™ã‚‹ã‚ˆã‚Šã‚‚ã€å¤§å¹…ãªã‚³ã‚¹ãƒˆå‰Šæ¸›ã€æœŸé–“çŸç¸®ãŒå¯èƒ½ã§ã™ã€‚
3.2 データã®æ‹¡å¼µ
データ拡張ã¯ã€æ—¢å˜ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’利用ã—ã€ç©ºé–“や色ã®ãƒ‰ãƒ¡ã‚¤ãƒ³ã§å¤‰æ›ã‚’æ–½ã™ã“ã¨ã§ã€å…ƒã®ç•«åƒã¨é¡žä¼¼ã—ã€ã‹ã¤å分ãªå·®ç•°ã‚’æŒã¤ç•«åƒã‚’æ–°ãŸã«ä½œæˆã™ã‚‹æ‰‹æ³•ã§ã™ã€‚ã“ã‚Œã«ã‚ˆã‚Šã€å¤‰å‹•æ€§ã®è¿½åŠ ã¨ãƒ¢ãƒ‡ãƒ«ã®ä¸€èˆ¬åŒ–を図りã¾ã™ã€‚ã“ã‚Œã¾ã§ã«ã€æœ€ã‚‚効果的ãªæ‹¡å¼µæ–¹æ³•ã‚’探るãŸã‚ã«å¤šãã®ç ”究ãŒè¡Œã‚ã‚Œã¦ãã¾ã—ãŸ1。一般的ãªå¤‰æ›æ–¹å¼ã¨ã—ã¦ã€å¹³è¡Œç§»å‹•ã€å›žè»¢ã€è‰²å¤‰æ›´ãªã©ãŒã‚ã‚Šã¾ã™ã€‚
å°‘é‡ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã‚’è¡Œã†ã¨ã€ãã®ãƒ¢ãƒ‡ãƒ«ã¯ã€å•é¡Œè§£æ±ºã«å¿…è¦ãªç‰¹å¾´ã‚’å¸ç¿’ã™ã‚‹ã®ã§ã¯ãªãã€ãƒ‡ãƒ¼ã‚¿ã®ãƒ‘ターンを記憶ã—始ã‚ã¾ã™ã€‚データ拡張ã«ã‚ˆã£ã¦ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®ã‚µã‚¤ã‚ºã‚’大ããã™ã‚Œã°ã€ãƒ‡ãƒ¼ã‚¿ã®è¤‡é›‘ã•ãŒå¢—ã—ã€è¨˜æ†¶ã§ã¯ãªã一般化ã›ã–ã‚‹ã‚’å¾—ãªããªã‚Šã¾ã™ã€‚ã“ã‚Œã«ã‚ˆã‚Šã€å¸ç¿’用データセットã«å¯¾ã™ã‚‹éŽå‰°é©åˆãŒæŠ‘ãˆã‚‰ã‚Œã€ã“ã‚Œã¾ã§ã«è¦‹ãŸã“ã¨ã®ãªã„ç•«åƒã«å¯¾ã™ã‚‹ãƒ‘フォーマンスãŒå‘上ã—ã¾ã™ã€‚データ拡張ã¯ã€ã•ã¾ã–ã¾ãªç…§æ˜Žæ¢ä»¶ã€ä½ç½®ã€æ–¹å‘ã®ã‚ªãƒ–ジェクトã«å¯¾å¿œã™ã‚‹å¯èƒ½æ€§ãŒã‚ã‚‹å ´åˆã«ç‰¹ã«æœ‰åŠ¹ã§ã™ã€‚
データ拡張を用ã„ã‚‹éš›ã¯ã€ã‚ªãƒ•ãƒ©ã‚¤ãƒ³ã¾ãŸã¯ã‚ªãƒ³ãƒ©ã‚¤ãƒ³ã§è¡Œã„ã¾ã™ã€‚オフライン拡張ã¯ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã®å‰ã«è¡Œã„ã€é©ç”¨ã•ã‚ŒãŸå¤‰æ›ã«ã‚ˆã£ã¦ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã«æ–°ã—ã„ç•«åƒãŒä½œæˆã•ã‚Œã¾ã™ã€‚ã“ã‚Œã«ã‚ˆã‚Šã€ãƒ¢ãƒ‡ãƒ«ãŒå¸ç¿’ã™ã‚‹ä¸€æ„ã®ç•«åƒã®æžšæ•¸ã‚’制御ã§ãã€ä¸€èˆ¬ã«ã€ã‚ˆã‚Šå°‘ãªã„エãƒãƒƒã‚¯ã§ãƒ¢ãƒ‡ãƒ«ã‚’åŽæŸã•ã›ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚オンライン拡張ã§ã¯ã€ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã«ä½¿ç”¨ã™ã‚‹å„ç•«åƒã«å¯¾ã—ã¦ã€ãƒ©ãƒ³ãƒ€ãƒ 化ã•ã‚ŒãŸå¤‰æ›ã‚’å‹•çš„ã«æ–½ã—ã¾ã™ã€‚ç•«åƒãŒè¿½åŠ ã§ä¿å˜ã•ã‚Œãªã„ãŸã‚ã€ä½™åˆ†ãªãƒ‡ã‚£ã‚¹ã‚¯å®¹é‡ã¯å¿…è¦ã‚ã‚Šã¾ã›ã‚“。 ã¾ãŸã€å¤‰æ›ã®ãŸã³ã«ä¸€æ„ã®ç•«åƒãŒä½œæˆã•ã‚Œã‚‹ãŸã‚ã€å¸¸ã«æ–°ã—ã„ç•«åƒã§ãƒ¢ãƒ‡ãƒ«ã‚’トレーニングã§ãã¾ã™ã€‚オンライン拡張を用ã„ãŸãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã§ã¯ã€å¸¸ã«æ–°ã—ã„ç•«åƒãŒæ示ã•ã‚Œã‚‹ãŸã‚ã€åŽæŸã™ã‚‹ã¾ã§ã«å¿…è¦ãªã‚¨ãƒãƒƒã‚¯æ•¸ãŒå¢—ãˆã‚‹å ´åˆãŒã‚ã‚Šã¾ã™ã€‚
3.3 TAO Toolkit ã§ã®ãƒ‡ãƒ¼ã‚¿æ‹¡å¼µ
TAO Toolkit ã¯ã€ã‚ªãƒ³ãƒ©ã‚¤ãƒ³ã¨ã‚ªãƒ•ãƒ©ã‚¤ãƒ³ã®ä¸¡æ–¹ã®ãƒ‡ãƒ¼ã‚¿æ‹¡å¼µã‚’サãƒãƒ¼ãƒˆã—ã¦ã„ã¾ã™ã€‚オフライン拡張ã§ã¯ã€ã‚¹ãƒšãƒƒã‚¯ ファイルをè¨å®šã—ã€ã‚³ãƒžãƒ³ãƒ‰ ライン インターフェイスã‹ã‚‰ç•«åƒã‚’生æˆã—ã¾ã™ã€‚ã“ã®è¨å®šã«ã‚ˆã‚Šã€ç©ºé–“ã€è‰²ã€ã¼ã‹ã—ã®æ‹¡å¼µåŠ 減をカスタマイズã—ã¾ã™ã€‚オンライン拡張もカスタマイズå¯èƒ½ã§ã€ç©ºé–“や色ã«ã¤ã„ã¦ã€ãƒ¢ãƒ‡ãƒ«ã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°æ™‚ã«é©ç”¨ã™ã‚‹æ‹¡å¼µç¯„囲を指定ã§ãã¾ã™ã€‚
TAO Toolkit ã§ãƒ‡ãƒ¼ã‚¿æ‹¡å¼µã‚’è¡Œã†å ´åˆã«æŽ¨å¥¨ã•ã‚Œã‚‹ã®ãŒã€å…ˆã«ã‚ªãƒ•ãƒ©ã‚¤ãƒ³æ‹¡å¼µã§ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®ã‚µã‚¤ã‚ºã‚’大ããã™ã‚‹ã“ã¨ã§ã™ã€‚ãã®å¾Œã§ã€ã‚ªãƒ³ãƒ©ã‚¤ãƒ³æ‹¡å¼µã§ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®è¤‡é›‘ã•ãŒã•ã‚‰ã«å¢—ã™ã‚ˆã†ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã‚’構æˆã—ã¾ã™ã€‚両方ã®ãƒ‡ãƒ¼ã‚¿æ‹¡å¼µã‚’組ã¿åˆã‚ã›ã‚‹ã“ã¨ã§ã€ãƒ¢ãƒ‡ãƒ«ã«å¤šç¨®å¤šæ§˜ãªç•«åƒã‚’æ示ã§ãã€å¾Œè¿°ã®æ‹¡å¼µã‚¿ã‚¹ã‚¯ã‚’実行ã—ãŸçµæžœã‹ã‚‰ã‚‚ã‚ã‹ã‚‹ã‚ˆã†ã«ã€ãƒ¢ãƒ‡ãƒ«ã®ãƒ‘フォーマンスãŒå‘上ã—ã¾ã™ã€‚



TAO Toolkit ã§ã‚µãƒãƒ¼ãƒˆã•ã‚Œã¦ã„る拡張方å¼ã‚’次ã®è¡¨ã«ç¤ºã—ã¾ã™ã€‚
空間 | オフライン | オンライン | 色 | オフライン | オンライン | |
---|---|---|---|---|---|---|
回転 | 色相回転 | |||||
å転 | 彩度変更 | |||||
平行移動 | コントラスト | |||||
傾ã | è¼åº¦ | |||||
ズーム| 色変更 | |||||
ã¼ã‹ã— | ||||||
表 1.TAO ã«ãŠã‘ã‚‹æ‹¡å¼µ |
3.4 çµè«–
データ拡張ã®ãƒ¡ãƒªãƒƒãƒˆã‚’示ã™ãŸã‚ã«ã€æ¬ 陥ã®ã‚るプリント基æ¿ã®ç•«åƒãŒ 100 æžšã—ã‹ãªã„データセットを例ã«ã¨ã‚Šã¾ã™ã€‚ã“ã®ãƒ¢ãƒ‡ãƒ«ã®ã‚¿ã‚¹ã‚¯ã¯ã€ãƒ—リント基æ¿ã®ç•«åƒã‹ã‚‰ 6 種類ã®æ¬ 陥を検出ã™ã‚‹ã“ã¨ã§ã™ã€‚é‡è¦ãªãƒ‘フォーマンス指標を mAP ã¨ã—ã€ãƒ¢ãƒ‡ãƒ«ã«ã‚ˆã£ã¦æ¬ 陥ã®å‘¨å›²ã«é…ç½®ã•ã‚Œã‚‹ãƒã‚¦ãƒ³ãƒ‡ã‚£ãƒ³ã‚° ボックスã®ç²¾åº¦ã‚’ã€ã‚°ãƒ©ã‚¦ãƒ³ãƒ‰ トゥルースã¨æ¯”較ã—ã¦è©•ä¾¡ã—ã¾ã™ã€‚
ã¾ãšã€ãƒ‡ãƒ¼ã‚¿æ‹¡å¼µãªã—ã® 100 æžšã®ç•«åƒã®ã¿ã§ãƒ¢ãƒ‡ãƒ«ã‚’トレーニングã—ã¾ã—ãŸã€‚次ã«ã€ã‚ªãƒ•ãƒ©ã‚¤ãƒ³æ‹¡å¼µã«ã‚ˆã£ã¦å…ƒã® 10 å€ã¨ 20 å€ã®ã‚µã‚¤ã‚ºã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’作æˆã—ã€æ¯”較ã®ãŸã‚ã«ã€ã“れらã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§ã‚ªãƒ³ãƒ©ã‚¤ãƒ³æ‹¡å¼µã‚ã‚Šã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã¨ã€ã‚ªãƒ³ãƒ©ã‚¤ãƒ³æ‹¡å¼µãªã—ã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã‚’è¡Œã„ã¾ã—ãŸã€‚
データ拡張ãªã—ã® 100 æžšã®ç•«åƒã®ã¿ã§ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã—ãŸã¨ã“ã‚ã€ãƒ†ã‚¹ãƒˆ セットã§ã® mAP 㯠36% ã«ã—ã‹åˆ°é”ã—ã¾ã›ã‚“ã§ã—ãŸã€‚ã—ã‹ã—ã€ä¸¡æ–¹ã®ãƒ‡ãƒ¼ã‚¿æ‹¡å¼µã‚’è¡Œã£ãŸçµæžœã€ãƒ¢ãƒ‡ãƒ«ã®ãƒ‘フォーマンスãŒå¤§å¹…ã«å‘上ã—ã€ç´„ 79% ã® mAP ã‚’é”æˆã—ã¾ã—ãŸã€‚ã“ã®ã‚¿ã‚¹ã‚¯ã¯ã€ç•«åƒãŒ 100 æžšã¨ã„ã†å°‘é‡ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®å ´åˆã§ã‚‚ã€ãƒ‡ãƒ¼ã‚¿æ‹¡å¼µãŒãƒ¢ãƒ‡ãƒ«ã®å“質å‘上ã«éžå¸¸ã«æœ‰åŠ¹ã§ã‚ã‚‹ã“ã¨ã‚’示ã—ã¦ã„ã¾ã™ã€‚

ã“ã“ã¾ã§ã®ãƒ—ãƒãƒˆã‚¿ã‚¤ãƒ—ã®ãƒ¢ãƒ‡ãƒ«ã§ã¯ã€100 æžšã®ç•«åƒã—ã‹ä½¿ç”¨ã—ã¦ã„ã¾ã›ã‚“。ãã“ã§ã€ã•ã‚‰ã«é«˜ã„精度をé”æˆã™ã‚‹ãŸã‚ã«ãƒ‡ãƒ¼ã‚¿ã‚’増やã™ã“ã¨ã«ã—ã€å…ˆã»ã©ã¨åŒã˜ã‚¿ã‚¹ã‚¯ã‚’ 500 æžšã®ã‚¢ãƒŽãƒ†ãƒ¼ã‚·ãƒ§ãƒ³æ¸ˆã¿ç•«åƒã§å®Ÿè¡Œã—ã¾ã™ã€‚データを増やã—ãŸã“ã¨ã§ã€ãƒ‡ãƒ¼ã‚¿æ‹¡å¼µã‚’一切行ã‚ãªãã¦ã‚‚ mAP 㯠82% ã§ã—ãŸã€‚ã•ã‚‰ã«ä¸¡æ–¹ã®ãƒ‡ãƒ¼ã‚¿æ‹¡å¼µã‚’è¡Œã£ãŸçµæžœã€mAP 㯠95% を超ãˆã¾ã—ãŸã€‚

TAO Toolkit ã§æä¾›ã•ã‚Œã¦ã„るデータ拡張をã€ã•ã¾ã–ã¾ãªã‚µã‚¤ã‚ºã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã«æ´»ç”¨ã—ã¦ã¿ã‚‹ã“ã¨ã‚’ãŠå‹§ã‚ã—ã¾ã™ã€‚TAO Toolkit ã¯ã€å°‘é‡ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§æ©Ÿæ¢°å¸ç¿’アプリケーションを迅速ã«è©¦ä½œã—よã†ã¨ã™ã‚‹å ´åˆã‚„ã€é«˜ç²¾åº¦ã®ãƒ¢ãƒ‡ãƒ«ã®ãƒ‘フォーマンスをã•ã‚‰ã«æ”¹å–„ã—よã†ã¨ã™ã‚‹å ´åˆã«æœ€é©ãªãƒ„ールã§ã™ã€‚
ã“ã®ã‚¿ã‚¹ã‚¯ã¯ã€ãƒ—リント基æ¿æ¬ 陥データセット を用ã„ã¦å®Ÿè¡Œã—ã¾ã—ãŸ2。çµæžœã‚’å†ç¾ã™ã‚‹ã™ã¹ã¦ã®ã‚³ãƒ¼ãƒ‰ã¨æ‰‹é †ã¯ã€TAO タスク GitHub リãƒã‚¸ãƒˆãƒªã§å…¬é–‹ã—ã¦ã„ã¾ã™ã€‚
1 Shorten, C., Khoshgoftaar, T.M. A survey on Image Data Augmentation for Deep Learning. J Big Data 6, 60 (2019). https://journalofbigdata.springeropen.com/articles/10.1186/s40537-019-0197-0
2 R. Ding, L. Dai, G. Li and H. Liu, "TDD-net: a tiny defect detection network for printed circuit boards," in CAAI Transactions on Intelligence Technology, vol. 4, no. 2, pp. 110-116, 6 2019, doi: 10.1049/trit.2019.0019.