Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
外観検査の難しさ
Search
OHNO
November 16, 2021
Research
0
530
外観検査の難しさ
OHNO
November 16, 2021
Tweet
Share
More Decks by OHNO
See All by OHNO
自社データを生成AIに活用
planeta
0
87
生成系AIで自データを扱うには
planeta
0
220
儲かるPython
planeta
0
240
画像処理ライブラリOpenCVの使い方0910
planeta
0
1.5k
Pythonによる工業用カメラ画像取得事例
planeta
0
1.4k
画像処理ライブラリOpenCVの使い方
planeta
0
1k
SONYのNNC
planeta
0
620
機械学習による動作認識
planeta
0
780
画像類似度計算
planeta
0
2k
Other Decks in Research
See All in Research
学習型データ構造:機械学習を内包する新しいデータ構造の設計と解析
matsui_528
6
3.7k
AIスーパーコンピュータにおけるLLM学習処理性能の計測と可観測性 / AI Supercomputer LLM Benchmarking and Observability
yuukit
1
720
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
960
Upgrading Multi-Agent Pathfinding for the Real World
kei18
0
380
存立危機事態の再検討
jimboken
0
250
LLMアプリケーションの透明性について
fufufukakaka
0
180
[IBIS 2025] 深層基盤モデルのための強化学習驚きから理論にもとづく納得へ
akifumi_wachi
20
9.8k
[チュートリアル] 電波マップ構築入門 :研究動向と課題設定の勘所
k_sato
0
310
Thirty Years of Progress in Speech Synthesis: A Personal Perspective on the Past, Present, and Future
ktokuda
0
180
LLM-Assisted Semantic Guidance for Sparsely Annotated Remote Sensing Object Detection
satai
3
570
生成的情報検索時代におけるAI利用と認知バイアス
trycycle
PRO
0
360
Grounding Text Complexity Control in Defined Linguistic Difficulty [Keynote@*SEM2025]
yukiar
0
120
Featured
See All Featured
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
64
53k
Testing 201, or: Great Expectations
jmmastey
46
8.1k
Balancing Empowerment & Direction
lara
5
930
The agentic SEO stack - context over prompts
schlessera
0
680
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
220
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
380
Game over? The fight for quality and originality in the time of robots
wayneb77
1
130
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
150
Tell your own story through comics
letsgokoyo
1
830
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
140
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
120
The Curse of the Amulet
leimatthew05
1
9.6k
Transcript
外観検査の難しさ 大野 宏 Python機械学習勉強会in新潟 2021/11/14
本日の概要 ・外観検査は認識率100%を求められるので難しい ・運用方法で工夫する ・Attention Branch Network (ABN)で認識率の向上 ・良品画像だけの学習で不良品を検査 オートエンコーダ GAN
ディープラーニングを使った外観検査 ・良品と不良品の画像を集めてネットワークを学習させる。 ・学習データにないパターンの不良品は検出できないこと がある。 不良パターンを予測しその画像を作り学習データとする。 運用しながら不良品の画像を集めて再学習させる。 → 再学習しても不良と判定するとは限らない ・99%の検査装置はできるが、100%は難しいのでどう 運用するか。
混同行列による評価1 予測 良品 不良品 実際 良品 95 0 不良品 0
5 ・混同行列とは、2値分類問題で実際の良・不良と予想し た良・不良を表したもの ・理想的な検査装置は認識率100% ・正確さは、(良品を良品と予測+不良品を不良品と予測) /(全数)=(95+5)/100=100%
混同行列による評価2 予測 良品 不良品 実際 良品 92 3 不良品 1
4 ・不良品を良品と予測したものがあると、不良品を出荷し てしまう。 ・偽陽性率は、不良品のうち良品と予測された割合は、 1/(1+4)=25% ・正確さは、(92+4)/100=96%
混同行列による評価3 予測 良品 不良品 実際 良品 90 5 不良品 0
5 ・不良品を良品と予測したものがゼロであれば、不良品と 予測した10個を再度目視検査すればよい。 ・目視検査数が100個から10個に減る ・偽陽性率は、0/(0+5)=0% ・正確さは、 (90+5)/100=95%
アテンション・ブランチ・ネットワーク1 ・誤認識したサンプルを正しく認識できるようにしたい ・誤認識したサンプルを学習に追加 → 正しく認識できるとは限らない ・ネットワークのパラメータを正しく認識できるように調整 すればいいが、数が膨大なのでどうしたら良いか? ・Attention Branch Network
(ABN)を使い手動でパラメー タを調整(中部大の山下研が提案) ・もともと視覚的説明による注視領域の可視化と精度向上 を同時に行うネットワーク、Grad-CAMより高性能
アテンション・ブランチ・ネットワーク2 ・Feature Extractor の後ろに Attenstion Branch と Perception Branch をつなぎ、両者の誤差で学習
http://mprg.jp/research/abn_j (中部大のABNの紹介)
アテンション・ブランチ・ネットワーク3
GitHubにて公開
オートエンコーダ ・不良品画像の収集が難しい場合に有効。 ・入力画像と出力画像が同じになるよう学習させる。 ・エンコーダで圧縮してデコーダで復元する。 エンコーダ (圧縮) デコーダ (復元) 入力 出力
圧縮され た特徴 (潜在変数)
良品画像だけから不良品を判別1 ・オートエンコーダは真似が得意で、良品画像を入力すると ほぼ同じ画像が出力される。 ・不良品画像では学習していないので、入力と出力の差が 大きくなる ・ラベル付けやアノテーションが不要 オート エンコーダ
入力 出力 良品画像だけから不良品を判別2 ・手書き数字で学習したオートエンコーダにひらがなを入力 すると、入出力に差が生じる。差が大きいと不良品と判定。 ・ただし出力画像がぼけてしまう。
入力 出力 画像のぼけを防ぐオートエンコーダ ・正常データだけでAEベースのモデル学習を行った後、推 論時に損失関数の勾配を利用し、AEによって得られた正 常データの多様体の最も近い所にマッピングされるように ICLR2020の異常検知論文を実装してみた https://qiita.com/kogepan102/items/122b2862ad5a51180656
MVTEC AD ・色々な工業製品の画像データ集 ・MVTECはドイツの画像処理メーカ、HALCONが有名 https://www.mvtec.com/company/research/datasets/mvtec-ad
GAN(Generative Adversarial Network) ・生成器と識別器が競い合って画像を生成するGANを 使い、良品画像だけから不良品を判別する。 16
AnoGAN ・GANでは画像のもととなる潜在変数を想定しており、こ れから学習に使う正常画像を生成する生成器を学習。 ・zの探索に時間がかかる。これも学習で→EfficientGAN 17 z G(z) x’ D(x’,x) x
Generator Discriminator
EfficientGAN 18 良品 不良品 出典:GANディープラーニング実装ハンドブック (秀和システム)
まとめ ・外観検査では混同行列で評価 ・Attention Branch Network (ABN)で認識率が向上 ・良品画像だけの学習で不良品を検出 オートエンコーダ GAN