タクトピクセル研究開発レポート 20190327

AI技術応用ソフトウェア開発タクトピクセル株式会社 1 2019/03/27 研究開発レポート

タクトピクセルの研究開発 2 クラウドアプリケーション開発深層学習 Encoder-Decoder model 良品学習画像処理印刷検査、ソフト
ウェア上の高速処理印刷製造別資料参照印刷画像向け深層学習画像分類エンジン・注目領域の可視化・クラウドアーキテクチャ・大容量データセットその他研究開発・Encoder-Decoderモデルによる良品学習と欠陥検出・画像処理フィルタの自動生成（デジタルからスキャン画像への直接変換）

印刷画像向け深層学習画像分類エンジン • TensorFlow(＋Keras)をベースにした印刷画像向け深層学習分類モデル作成エンジン • Python言語で使用可能 • 基本機能 • 画像ファイルリスト作成
• データの増幅（前処理） • データ分割 • 入力画像データのキャッシュ機能 • 学習、モデル作成 • 推論処理 • 注目領域可視化機能 • Web Server機能(AWS仮想環境への対応)

印刷画像向けの特徴技術課題・定量的な問題が多い・複数画像を入力・背景絵柄が変化する犬や猫などの写真(3チャンネルカラー画像)分類はノウハウが一般化してきている検査
・自動検査装置の結果の精度をさらに向上させたい・結果を解析して生産管理に生かしたい印刷画像向け深層学習画像分類エンジン → 問題設定の見直し → モデルの工夫 → 大規模データ学習

画像の例良品／不良品分類欠陥品種分類画像と分類項目の例 × 不良品 × 不良品 × 不良品
良品良品毛ごみインキカス汚れ異物見当ズレ毛ごみの付着は不良品として処置するインキカスは不良品として処置する汚れは不良品として処置する払ったら落ちる異物は良品扱い微細な見当ズレは良品扱い印刷画像向け深層学習画像分類エンジン

深層学習モデルの設計入力層中間層中間層出力層 [b, x, y, c] b:
バッチサイズ x: 画像サイズ幅 y: 画像サイズ高さ c: 画像チャンネル数画像チャンネル数を4 チャンネル以上にする適切な前処理を行う適切な規模のネットワーク構造とする（大きすぎるのも良くない）全結合層(Fully Connected)層より Global Average Pooling層学習条件・ImageNet等からの転移学習は行わない。ランダム初期値で学習を開始する。・StepwiseでLearning Rateを設定する。・Optimizerはあまり精度に影響しない。 Dropout層よりBatch Normalize 層が重要 Residual層も取り入れる 11,283,478 26,073,878 23,593,174 50,474,518 134,360,598 55,784,214 139,670,294 21,818,390 54,313,942 0 20,000,000 40,000,000 60,000,000 80,000,000 100,000,000 120,000,000 140,000,000 160,000,000 Parameter size 定性的な分類問題に落とし込む精度と計算量のバランスがいい印刷画像向け深層学習画像分類エンジン

大量画像データセットの学習画像の読み込みネットワーク構造の定義初期重み値の設定一度に画像を読み込んで前処理を行う仕組みではRAMの容量を超えた画像を学習することができない。画像情報のストレージへのキャッシュとバッチ毎読み込みの仕組みによって、数万枚規模のデータセットでも安定的に学習処理を行うことができる。画像の読み込み・キャッシュ作成ネットワーク構造の定義初期重み値の設定
エポックサイクルバッチ学習サイクル推論、勾配、重み計算エポックサイクルバッチ学習サイクル推論、勾配、重み計算キャッシュ読み込み印刷画像向け深層学習画像分類エンジン

Amazon S3 画像検査装置など現場の管理者お客様のネットワーク AWS Batch Managed ECS Amazon
ECR コンテナ作成進行状況/完了通知 Amazon SES 学習/推論スクリプト (Python) AWS Lambda AWS CodeBuild AWS CodePipeline 10GB~1TB Amazon ECS, Fargate 管理アプリケーション Amazon RDS Amazon ECS, Fargate 認証アプリケーション Amazon RDS 学習処理スポットインスタンス (p2, p3) 顧客データストレージ Amazon ECS, Fargate GUI AWS Cloud 機械学習のクラウドアーキテクチャ印刷画像向け深層学習画像分類エンジン

注目領域の可視化(Saliency MAP) Interpretable Explanations of Black Boxes by Meaningful Perturbation
: http://openaccess.thecvf.com/content_ICCV_2017/papers/Fong_Interpretable_Explanations_of_ICCV_2017_paper.pdf [1610.02391] Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization : https://arxiv.org/abs/1610.02391 [1710.11063] Grad-CAM++: Improved Visual Explanations for Deep Convolutional Networks : https://arxiv.org/abs/1710.11063 深層学習モデルによって推測された結果は途中の計算結果を理解することが困難であるため、説明できる深層学習(Interpretable DL)の研究が盛んに行われている。分類処理を行った後に「なぜその判断を行ったか？」を可視化することにより、そのモデルが汎化能力を獲得しているかを間接的に分析することができる。ニューラルネットワーク構造に制約されない、より安定的に利用できるmask法で実装した。印刷画像向け深層学習画像分類エンジン $ dlc-titan predict-ss --model-network ${SOURCE}/network.json --model-weight ${SOURCE}/trained.h5 --image-input-model ${F1} ${F2} -- cam-type Grad-CAM --image-masking-stride 1,1 --grid 16,16 --image-target-size 112,112,3 --last-conv-layer prediction --output- dir ./predict-ss/output/ --output-heatmap ./predict-ss/heatmap/${F2##*/} --verbose DLC-Titanに実装済み

Encoder-Decoder による良品学習と欠陥検出良品データの準備 (100枚) データの前処理ノイズ付加入力層圧縮特徴出力層
Encoder Decoder ハイパーパラメータ、ネットワークモデルの構造、ノイズの与え方については、印刷の特徴に合わせた調整が必要。その他研究開発

Encoder-Decoder による良品学習と欠陥検出 • 不良品画像の収集が不要である。（従来手法と同じ） • 基準画像との差分ではないので、あいまいな検知ができる • 位置決め無しで欠陥を検出す
ることができる • 検査領域の枠を引いたりなどの細かい設定が不要になる未知のデータ予測された良品比較検査アルゴリズムその他研究開発

画像処理フィルタの自動生成 12 ？色調整ぼかし輪郭抽出ゆがみ・遺伝的アルゴリズム・深層学習 (Encoder-Decoder)
変換器比較対象の間にある関係性を定義する。カラー変換だけに関しては、CMYK→RGBの4次元から3次元色空間の近似変換行列の生成アルゴリズムが有用である。その他研究開発

デジタルからスキャン画像への直接変換 13 色合い、ノイズの乗り方、ボケ方、各版のズレ様々な部分で異なるデザインデータ実物のスキャンデータその他研究開発深層学習遺伝的アルゴリズム

タクトピクセル株式会社 [email protected] https://taktpixel.co.jp/#contact お問い合わせ

タクトピクセル研究開発レポート 20190327

タクトピクセル研究開発レポート 20190327

Taktpixel Co., Ltd.

More Decks by Taktpixel Co., Ltd.

Other Decks in Technology

Featured

Transcript

AI技術応用ソフトウェア開発タクトピクセル株式会社 1 2019/03/27 研究開発レポート

タクトピクセルの研究開発 2 クラウドアプリケーション開発深層学習 Encoder-Decoder model 良品学習画像処理印刷検査、ソフト

印刷画像向け深層学習画像分類エンジン • TensorFlow(＋Keras)をベースにした印刷画像向け深層学習分類モデル作成エンジン • Python言語で使用可能 • 基本機能 • 画像ファイルリスト作成

印刷画像向けの特徴技術課題・定量的な問題が多い・複数画像を入力・背景絵柄が変化する犬や猫などの写真(3チャンネルカラー画像)分類はノウハウが一般化してきている検査

画像の例良品／不良品分類欠陥品種分類画像と分類項目の例 × 不良品 × 不良品 × 不良品

深層学習モデルの設計入力層中間層中間層出力層 [b, x, y, c] b:

Amazon S3 画像検査装置など現場の管理者お客様のネットワーク AWS Batch Managed ECS Amazon

注目領域の可視化(Saliency MAP) Interpretable Explanations of Black Boxes by Meaningful Perturbation

Encoder-Decoder による良品学習と欠陥検出良品データの準備 (100枚) データの前処理ノイズ付加入力層圧縮特徴出力層

Encoder-Decoder による良品学習と欠陥検出 • 不良品画像の収集が不要である。（従来手法と同じ） • 基準画像との差分ではないので、あいまいな検知ができる • 位置決め無しで欠陥を検出す

画像処理フィルタの自動生成 12 ？色調整ぼかし輪郭抽出ゆがみ・遺伝的アルゴリズム・深層学習 (Encoder-Decoder)

デジタルからスキャン画像への直接変換 13 色合い、ノイズの乗り方、ボケ方、各版のズレ様々な部分で異なるデザインデータ実物のスキャンデータその他研究開発深層学習遺伝的アルゴリズム

タクトピクセル株式会社 [email protected] https://taktpixel.co.jp/#contact お問い合わせ

タクトピクセル 研究開発レポート 20190327

タクトピクセル 研究開発レポート 20190327

More Decks by Taktpixel Co., Ltd.

Other Decks in Technology

Featured

Transcript

タクトピクセル研究開発レポート 20190327

タクトピクセル研究開発レポート 20190327