Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
外観検査の難しさ
OHNO
November 16, 2021
Research
0
210
外観検査の難しさ
OHNO
November 16, 2021
Tweet
Share
More Decks by OHNO
See All by OHNO
儲かるPython
planeta
0
170
画像処理ライブラリOpenCVの使い方0910
planeta
0
870
Pythonによる工業用カメラ画像取得事例
planeta
0
730
画像処理ライブラリOpenCVの使い方
planeta
0
540
SONYのNNC
planeta
0
310
機械学習による動作認識
planeta
0
510
画像類似度計算
planeta
0
1.1k
Tensorflow/Keras(Python)で作ったモデルをC++で使う
planeta
0
1.3k
Other Decks in Research
See All in Research
【西多摩電波調査】調査報告書
5g_digitalservicetmg
0
290
On the Training of Infinitely Deep and Wide ResNets
gpeyre
0
200
第21回チャンピオンズミーティング・カプリコーン杯ラウンド2集計 / Umamusume Capricorn 2023 Round2
kitachan_black
0
450
テーブル・画像・テキストの反実仮想説明
masatoto
0
200
RecSys22読み会_MTRS
daimoriwaki
0
340
データ分析の進め方とニュースメディアでのデータ活用事例 / data-analysis-in-kaggle-and-news-media
upura
0
490
チュートリアル: ユーザビリティはどう測る? ~評価手法とその利用~ / How do we measure usability? -Evaluation Methods and Their Use
akirakanaoka
0
410
(最先端NLP2022)DiffCSE: Difference-based Contrastive Learning for Sentence Embeddings
chanabek326
2
560
ABEMAにおけるサムネイル検証とOPE活用
ebisawahayata
1
860
Semantic Shift Stability: Efficient Way to Detect Performance Degradation of Word Embeddings and Pre-trained Language Models
upura
0
830
第20回チャンピオンズミーティング・サジタリウス杯ラウンド1集計 / Umamusume Sagittarius 2022 Round1
kitachan_black
0
620
第18回チャンピオンズミーティング・ライブラ杯ラウンド2集計 / Umamusume Libra 2022 Round2
kitachan_black
0
820
Featured
See All Featured
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
31
20k
Practical Orchestrator
shlominoach
178
8.9k
The Invisible Customer
myddelton
113
12k
5 minutes of I Can Smell Your CMS
philhawksworth
198
18k
The Language of Interfaces
destraynor
149
21k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
15
1.2k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
44
14k
The MySQL Ecosystem @ GitHub 2015
samlambert
240
11k
Put a Button on it: Removing Barriers to Going Fast.
kastner
56
2.5k
Unsuck your backbone
ammeep
659
56k
Fantastic passwords and where to find them - at NoRuKo
philnash
32
1.9k
The Invisible Side of Design
smashingmag
292
48k
Transcript
外観検査の難しさ 大野 宏 Python機械学習勉強会in新潟 2021/11/14
本日の概要 ・外観検査は認識率100%を求められるので難しい ・運用方法で工夫する ・Attention Branch Network (ABN)で認識率の向上 ・良品画像だけの学習で不良品を検査 オートエンコーダ GAN
ディープラーニングを使った外観検査 ・良品と不良品の画像を集めてネットワークを学習させる。 ・学習データにないパターンの不良品は検出できないこと がある。 不良パターンを予測しその画像を作り学習データとする。 運用しながら不良品の画像を集めて再学習させる。 → 再学習しても不良と判定するとは限らない ・99%の検査装置はできるが、100%は難しいのでどう 運用するか。
混同行列による評価1 予測 良品 不良品 実際 良品 95 0 不良品 0
5 ・混同行列とは、2値分類問題で実際の良・不良と予想し た良・不良を表したもの ・理想的な検査装置は認識率100% ・正確さは、(良品を良品と予測+不良品を不良品と予測) /(全数)=(95+5)/100=100%
混同行列による評価2 予測 良品 不良品 実際 良品 92 3 不良品 1
4 ・不良品を良品と予測したものがあると、不良品を出荷し てしまう。 ・偽陽性率は、不良品のうち良品と予測された割合は、 1/(1+4)=25% ・正確さは、(92+4)/100=96%
混同行列による評価3 予測 良品 不良品 実際 良品 90 5 不良品 0
5 ・不良品を良品と予測したものがゼロであれば、不良品と 予測した10個を再度目視検査すればよい。 ・目視検査数が100個から10個に減る ・偽陽性率は、0/(0+5)=0% ・正確さは、 (90+5)/100=95%
アテンション・ブランチ・ネットワーク1 ・誤認識したサンプルを正しく認識できるようにしたい ・誤認識したサンプルを学習に追加 → 正しく認識できるとは限らない ・ネットワークのパラメータを正しく認識できるように調整 すればいいが、数が膨大なのでどうしたら良いか? ・Attention Branch Network
(ABN)を使い手動でパラメー タを調整(中部大の山下研が提案) ・もともと視覚的説明による注視領域の可視化と精度向上 を同時に行うネットワーク、Grad-CAMより高性能
アテンション・ブランチ・ネットワーク2 ・Feature Extractor の後ろに Attenstion Branch と Perception Branch をつなぎ、両者の誤差で学習
http://mprg.jp/research/abn_j (中部大のABNの紹介)
アテンション・ブランチ・ネットワーク3
GitHubにて公開
オートエンコーダ ・不良品画像の収集が難しい場合に有効。 ・入力画像と出力画像が同じになるよう学習させる。 ・エンコーダで圧縮してデコーダで復元する。 エンコーダ (圧縮) デコーダ (復元) 入力 出力
圧縮され た特徴 (潜在変数)
良品画像だけから不良品を判別1 ・オートエンコーダは真似が得意で、良品画像を入力すると ほぼ同じ画像が出力される。 ・不良品画像では学習していないので、入力と出力の差が 大きくなる ・ラベル付けやアノテーションが不要 オート エンコーダ
入力 出力 良品画像だけから不良品を判別2 ・手書き数字で学習したオートエンコーダにひらがなを入力 すると、入出力に差が生じる。差が大きいと不良品と判定。 ・ただし出力画像がぼけてしまう。
入力 出力 画像のぼけを防ぐオートエンコーダ ・正常データだけでAEベースのモデル学習を行った後、推 論時に損失関数の勾配を利用し、AEによって得られた正 常データの多様体の最も近い所にマッピングされるように ICLR2020の異常検知論文を実装してみた https://qiita.com/kogepan102/items/122b2862ad5a51180656
MVTEC AD ・色々な工業製品の画像データ集 ・MVTECはドイツの画像処理メーカ、HALCONが有名 https://www.mvtec.com/company/research/datasets/mvtec-ad
GAN(Generative Adversarial Network) ・生成器と識別器が競い合って画像を生成するGANを 使い、良品画像だけから不良品を判別する。 16
AnoGAN ・GANでは画像のもととなる潜在変数を想定しており、こ れから学習に使う正常画像を生成する生成器を学習。 ・zの探索に時間がかかる。これも学習で→EfficientGAN 17 z G(z) x’ D(x’,x) x
Generator Discriminator
EfficientGAN 18 良品 不良品 出典:GANディープラーニング実装ハンドブック (秀和システム)
まとめ ・外観検査では混同行列で評価 ・Attention Branch Network (ABN)で認識率が向上 ・良品画像だけの学習で不良品を検出 オートエンコーダ GAN