Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
外観検査の難しさ
Search
OHNO
November 16, 2021
Research
0
520
外観検査の難しさ
OHNO
November 16, 2021
Tweet
Share
More Decks by OHNO
See All by OHNO
自社データを生成AIに活用
planeta
0
72
生成系AIで自データを扱うには
planeta
0
210
儲かるPython
planeta
0
240
画像処理ライブラリOpenCVの使い方0910
planeta
0
1.5k
Pythonによる工業用カメラ画像取得事例
planeta
0
1.4k
画像処理ライブラリOpenCVの使い方
planeta
0
1k
SONYのNNC
planeta
0
610
機械学習による動作認識
planeta
0
770
画像類似度計算
planeta
0
2k
Other Decks in Research
See All in Research
心理言語学の視点から再考する言語モデルの学習過程
chemical_tree
2
690
財務諸表監査のための逐次検定
masakat0
0
200
Remote sensing × Multi-modal meta survey
satai
4
610
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
390
さまざまなAgent FrameworkとAIエージェントの評価
ymd65536
1
320
MetaEarth: A Generative Foundation Model for Global-Scale Remote Sensing Image Generation
satai
4
450
Time to Cash: The Full Stack Breakdown of Modern ATM Attacks
ratatata
0
170
Panopticon: Advancing Any-Sensor Foundation Models for Earth Observation
satai
3
370
[RSJ25] Enhancing VLA Performance in Understanding and Executing Free-form Instructions via Visual Prompt-based Paraphrasing
keio_smilab
PRO
0
170
ロボット学習における大規模検索技術の展開と応用
denkiwakame
1
170
言語モデルの地図:確率分布と情報幾何による類似性の可視化
shimosan
8
2.1k
[IBIS 2025] 深層基盤モデルのための強化学習驚きから理論にもとづく納得へ
akifumi_wachi
14
7.5k
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Testing 201, or: Great Expectations
jmmastey
46
7.8k
Designing for humans not robots
tammielis
254
26k
The Invisible Side of Design
smashingmag
302
51k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Raft: Consensus for Rubyists
vanstee
140
7.2k
Building Applications with DynamoDB
mza
96
6.8k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
We Have a Design System, Now What?
morganepeng
54
7.9k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Transcript
外観検査の難しさ 大野 宏 Python機械学習勉強会in新潟 2021/11/14
本日の概要 ・外観検査は認識率100%を求められるので難しい ・運用方法で工夫する ・Attention Branch Network (ABN)で認識率の向上 ・良品画像だけの学習で不良品を検査 オートエンコーダ GAN
ディープラーニングを使った外観検査 ・良品と不良品の画像を集めてネットワークを学習させる。 ・学習データにないパターンの不良品は検出できないこと がある。 不良パターンを予測しその画像を作り学習データとする。 運用しながら不良品の画像を集めて再学習させる。 → 再学習しても不良と判定するとは限らない ・99%の検査装置はできるが、100%は難しいのでどう 運用するか。
混同行列による評価1 予測 良品 不良品 実際 良品 95 0 不良品 0
5 ・混同行列とは、2値分類問題で実際の良・不良と予想し た良・不良を表したもの ・理想的な検査装置は認識率100% ・正確さは、(良品を良品と予測+不良品を不良品と予測) /(全数)=(95+5)/100=100%
混同行列による評価2 予測 良品 不良品 実際 良品 92 3 不良品 1
4 ・不良品を良品と予測したものがあると、不良品を出荷し てしまう。 ・偽陽性率は、不良品のうち良品と予測された割合は、 1/(1+4)=25% ・正確さは、(92+4)/100=96%
混同行列による評価3 予測 良品 不良品 実際 良品 90 5 不良品 0
5 ・不良品を良品と予測したものがゼロであれば、不良品と 予測した10個を再度目視検査すればよい。 ・目視検査数が100個から10個に減る ・偽陽性率は、0/(0+5)=0% ・正確さは、 (90+5)/100=95%
アテンション・ブランチ・ネットワーク1 ・誤認識したサンプルを正しく認識できるようにしたい ・誤認識したサンプルを学習に追加 → 正しく認識できるとは限らない ・ネットワークのパラメータを正しく認識できるように調整 すればいいが、数が膨大なのでどうしたら良いか? ・Attention Branch Network
(ABN)を使い手動でパラメー タを調整(中部大の山下研が提案) ・もともと視覚的説明による注視領域の可視化と精度向上 を同時に行うネットワーク、Grad-CAMより高性能
アテンション・ブランチ・ネットワーク2 ・Feature Extractor の後ろに Attenstion Branch と Perception Branch をつなぎ、両者の誤差で学習
http://mprg.jp/research/abn_j (中部大のABNの紹介)
アテンション・ブランチ・ネットワーク3
GitHubにて公開
オートエンコーダ ・不良品画像の収集が難しい場合に有効。 ・入力画像と出力画像が同じになるよう学習させる。 ・エンコーダで圧縮してデコーダで復元する。 エンコーダ (圧縮) デコーダ (復元) 入力 出力
圧縮され た特徴 (潜在変数)
良品画像だけから不良品を判別1 ・オートエンコーダは真似が得意で、良品画像を入力すると ほぼ同じ画像が出力される。 ・不良品画像では学習していないので、入力と出力の差が 大きくなる ・ラベル付けやアノテーションが不要 オート エンコーダ
入力 出力 良品画像だけから不良品を判別2 ・手書き数字で学習したオートエンコーダにひらがなを入力 すると、入出力に差が生じる。差が大きいと不良品と判定。 ・ただし出力画像がぼけてしまう。
入力 出力 画像のぼけを防ぐオートエンコーダ ・正常データだけでAEベースのモデル学習を行った後、推 論時に損失関数の勾配を利用し、AEによって得られた正 常データの多様体の最も近い所にマッピングされるように ICLR2020の異常検知論文を実装してみた https://qiita.com/kogepan102/items/122b2862ad5a51180656
MVTEC AD ・色々な工業製品の画像データ集 ・MVTECはドイツの画像処理メーカ、HALCONが有名 https://www.mvtec.com/company/research/datasets/mvtec-ad
GAN(Generative Adversarial Network) ・生成器と識別器が競い合って画像を生成するGANを 使い、良品画像だけから不良品を判別する。 16
AnoGAN ・GANでは画像のもととなる潜在変数を想定しており、こ れから学習に使う正常画像を生成する生成器を学習。 ・zの探索に時間がかかる。これも学習で→EfficientGAN 17 z G(z) x’ D(x’,x) x
Generator Discriminator
EfficientGAN 18 良品 不良品 出典:GANディープラーニング実装ハンドブック (秀和システム)
まとめ ・外観検査では混同行列で評価 ・Attention Branch Network (ABN)で認識率が向上 ・良品画像だけの学習で不良品を検出 オートエンコーダ GAN