Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
【深度學習】04 圖形辨識的天王 CNN
Search
[email protected]
March 28, 2022
Technology
0
250
【深度學習】04 圖形辨識的天王 CNN
2022 政大應數「數學軟體應用」深度學習課程 04
[email protected]
March 28, 2022
Tweet
Share
More Decks by
[email protected]
See All by
[email protected]
【深度學習】08 強化學習
yenlung
0
360
Contrastive Self-Supervised Learning
yenlung
0
430
【深度學習】07 生成模式和 GAN
yenlung
0
380
【深度學習】06 RNN 實務與 Transformers
yenlung
0
320
【深度學習】05 有記憶的神經網路 RNN
yenlung
0
150
【深度學習】03 神經網路是怎麼學的
yenlung
0
190
【深度學習】02 AI 就是問個好問題
yenlung
0
190
咖啡沖煮簡介
yenlung
0
1.2k
深度學習入門
yenlung
0
380
Other Decks in Technology
See All in Technology
2025年に挑戦したいこと
molmolken
0
160
ドメイン駆動設計の実践により事業の成長スピードと保守性を両立するショッピングクーポン
lycorptech_jp
PRO
13
2.2k
JAWS-UG20250116_iOSアプリエンジニアがAWSreInventに行ってきた(真面目編)
totokit4
0
140
re:Invent 2024のふりかえり
beli68
0
110
AWS Community Builderのススメ - みんなもCommunity Builderに応募しよう! -
smt7174
0
180
深層学習と3Dキャプチャ・3Dモデル生成(土木学会応用力学委員会 応用数理・AIセミナー)
pfn
PRO
0
460
商品レコメンドでのexplicit negative feedbackの活用
alpicola
2
370
AWSマルチアカウント統制環境のすゝめ / 20250115 Mitsutoshi Matsuo
shift_evolve
0
120
あなたの知らないクラフトビールの世界
miura55
0
130
KMP with Crashlytics
sansantech
PRO
0
240
デジタルアイデンティティ技術 認可・ID連携・認証 応用 / 20250114-OIDF-J-EduWG-TechSWG
oidfj
2
680
AWS re:Invent 2024 re:Cap Taipei (for Developer): New Launches that facilitate Developer Workflow and Continuous Innovation
dwchiang
0
170
Featured
See All Featured
RailsConf 2023
tenderlove
29
970
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
570
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Making Projects Easy
brettharned
116
6k
Automating Front-end Workflow
addyosmani
1366
200k
Agile that works and the tools we love
rasmusluckow
328
21k
Building Flexible Design Systems
yeseniaperezcruz
328
38k
Gamification - CAS2011
davidbonilla
80
5.1k
Writing Fast Ruby
sferik
628
61k
Mobile First: as difficult as doing things right
swwweet
222
9k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
1.2k
Done Done
chrislema
182
16k
Transcript
政⼤應數。數學軟體應⽤ 蔡炎龍 圖形辨識的天王 CNN 政治⼤學應⽤數學系 深度學習入⾨ 04.
圖形辨識天王 CNN 10.
數學軟體應⽤ 193 卷積神經網路 CNN Convolutional Neural Networks 圖形辨識的超級天王
數學軟體應⽤ 194 圖形辨識有太多的應⽤ f “台灣⿊熊” 動物識別。
數學軟體應⽤ 195 圖形辨識有太多的應⽤ π 往左 ⽤電腦玩遊戲。
數學軟體應⽤ 196 深度學習三巨頭 Geoffrey Hinton Yann LeCun Yoshua Bengio 博⼠後學⽣
博⼠後共事
數學軟體應⽤ 197 Yann LeCun 1987 Universite Pierre et Marie Curie
(巴黎第六⼤學) 資訊科學博⼠ University of Toronto 博⼠後研究 1988- Bell 實驗室 2003 NYU 教授 2013 Facebook AI Director Yann LeCun 博⼠就研究 ConvNet (不全連結的神經網路)
數學軟體應⽤ 198 救了神經網路功⾂之⼀ CNN ⼤約 1995 年, ⼤家 對神經網路失去了 興趣...
LeCun
數學軟體應⽤ 199 救了神經網路功⾂之⼀ CNN 只要別的⽅法更好、 甚⾄⼀様好, ⼤家就 不想⽤神經網路! Hinton 神經網路吃虧的地⽅...
數學軟體應⽤ 200 救了神經網路功⾂之⼀ CNN 圖形辨識 SVM 強強的! 比如 2011 ImageNet
⼤型圖 形辨識比賽冠軍: XRCE
數學軟體應⽤ 201 救了神經網路功⾂之⼀ CNN 圖形辨識進入 CNN 時代! AlexNet 2012 ImageNet
⼤型圖 形辨識比賽冠軍, 狂勝 XRCE!
數學軟體應⽤ 202 CNN 經典作品 這些都是 Tensorflow 準備 好可以給你⽤的! InceptionV3 GoogLeNet,
V1 是 2014 冠軍 VGG16/VGG19 2014 亞軍 ResNet50 2015 冠軍
數學軟體應⽤ 203 CNN 的兩種隱藏層 卷積層 (convolutional layer) 池化層 (pooling layer)
CNN 特有兩種隱 藏層的形式, ⼀般 兩種都會⽤到。
數學軟體應⽤ 204 卷積層 Convolutional Layer 1 Convolutional Layer 卷積層 CNN
的核⼼!
數學軟體應⽤ 205 設計卷積層 設計⼀層卷積層, 我們只需要... 幾個 filter 每個 filter 的⼤⼩
(比如 ) 3 × 3 1 2 簡單!
數學軟體應⽤ 206 Filter 的作⽤ 每個 filter 看⼀個特徵, 掃過每⼀個點, 紀錄該點附近的「特徵強度」。於是 紀錄在⾃⼰的「記分板」上。
filter 1 filter 2 input 記分板 記分板
數學軟體應⽤ 207 Filter 卷積的運算 d 11 d 12 d 13
d 14 d 21 d 22 d 23 d 24 d 31 d 32 d 33 d 34 d 41 d 42 d 43 d 44 … input [ 0 1 0 0 1 0 0 1 0] * filter ⼀個 filter 就像個權 做加 權和, 也就是內積 (dot product)。 d 11 × 0 + d 12 × 1 + d 13 × 0 + d 21 × 0 + d 22 × 1 + d 23 × 0 + d 31 × 0 + d 32 × 1 + d 33 × 0 =
數學軟體應⽤ 208 Filter 卷積的運算 2 5 5 2 5 2
0 1 2 3 4 0 4 2 1 5 4 3 1 3 5 5 4 3 5 3 4 5 0 2 1 5 2 3 1 1 1 0 1 3 4 4 1 1 5 1 1 4 2 3 2 2 0 4 2 4 0 5 4 5 3 4 1 4 35 想成這是⼀張圖所成的矩陣 filter 內積 這學來的 W= ⼀個 filter 就看 ⼀個特徵, 紀錄在 記分板上。 記分板
數學軟體應⽤ 209 Filter 卷積的運算 同⼀個 filter, 當 然矩陣 (權 )
是 ⼀樣的。 記分板 2 5 5 2 5 2 0 1 2 3 4 0 4 2 1 5 4 3 1 3 5 5 4 3 5 3 4 5 0 2 1 5 2 3 1 1 1 0 1 3 4 4 1 1 5 1 1 4 2 3 2 2 0 4 2 4 0 5 4 5 3 4 1 4 35 27 filter 右移⼀格 還是⼀樣的矩陣 W=
數學軟體應⽤ 210 Filter 卷積的運算 掃到最後, 完成這個 filter 的計分板。 要注意的是, 這內積的
部份只有我們原本的加 權和, 事實上還是要加 上偏值、經激發函數轉 換送出! 記分板 2 5 5 2 5 2 0 1 2 3 4 0 4 2 1 5 4 3 1 3 5 5 4 3 5 3 4 5 0 2 1 5 2 3 1 1 1 0 1 3 4 4 1 1 5 1 1 4 2 3 2 2 0 4 2 4 0 5 4 5 3 4 1 4 35 27 44 32 36 38 36 36 37 36 36 43 37 37 23 26 17 35 29 25 22 18 14 27 27 25 24 21 24 32 31 38 27 34 25 40 filter ⼀路到最後 W=
數學軟體應⽤ 211 為什麼卷積會抽取特徵? [ 0 1 0 0 1 0
0 1 0] 0 1 0 0 1 0 0 1 0 [ 1 0 0 0 1 0 0 0 1] 3分 1分 Filter 1 Filter 2 圖 我們來看同⼀張圖,對兩 個不同的 filter 運算的 結果。 可以看出⼀樣的會得⾼ 分!
數學軟體應⽤ 212 為什麼卷積會抽取特徵? [ 0 1 0 0 1 0
0 1 0] 1 0 0 0 1 0 0 0 1 [ 1 0 0 0 1 0 0 0 1] Filter 1 Filter 2 圖 3分 1分 換另⼀張圖發現, 真的 像的會得到⾼分!
數學軟體應⽤ 213 卷積層其實神經元動作是⼀樣的! 我們⾺上會發現, 卷積層其 實只是「不完全連結」的 神經網路, 神經元的運算⽅ 式是⼀樣的!
數學軟體應⽤ 214 輸入的圖每個像素可當成⼀個神經元 2 5 5 2 5 2 0
1 2 3 4 0 4 2 1 5 4 3 1 3 5 5 4 3 5 3 4 5 0 2 1 5 2 3 1 1 1 0 1 3 4 4 1 1 5 1 1 4 2 3 2 2 0 4 2 4 0 5 4 5 3 4 1 4 35 27 44 32 36 38 36 36 37 36 36 43 37 37 23 26 17 35 29 25 22 18 14 27 27 25 24 21 24 32 31 38 27 34 25 40 filter 圖片上的點是⼀個個輸入層 神經元 W=
數學軟體應⽤ 215 記分板也是⼀個個神經元組成 2 5 5 2 5 2 0
1 2 3 4 0 4 2 1 5 4 3 1 3 5 5 4 3 5 3 4 5 0 2 1 5 2 3 1 1 1 0 1 3 4 4 1 1 5 1 1 4 2 3 2 2 0 4 2 4 0 5 4 5 3 4 1 4 35 27 44 32 36 38 36 36 37 36 36 43 37 37 23 26 17 35 29 25 22 18 14 27 27 25 24 21 24 32 31 38 27 34 25 40 filter Conv 層也是⼀個個神經元 W= 記分板每⼀個分數的位 ⼦也是⼀個神經元。
數學軟體應⽤ 216 不是完全連結的神經網路 記分板⼀個數字 (⼀個 神經元) 只和輸入的九 個神經元相連。 2 5
5 2 5 2 0 1 2 3 4 0 4 2 1 5 4 3 1 3 5 5 4 3 5 3 4 5 0 2 1 5 2 3 1 1 1 0 1 3 4 4 1 1 5 1 1 4 2 3 2 2 0 4 2 4 0 5 4 5 3 4 1 4 35 27 44 32 36 38 36 36 37 36 36 43 37 37 23 26 17 35 29 25 22 18 14 27 27 25 24 21 24 32 31 38 27 34 25 40 filter 兩層中沒有完全相連 W=
數學軟體應⽤ 217 權 是相同的 (對同⼀個 filter) 2 5 5 2
5 2 0 1 2 3 4 0 4 2 1 5 4 3 1 3 5 5 4 3 5 3 4 5 0 2 1 5 2 3 1 1 1 0 1 3 4 4 1 1 5 1 1 4 2 3 2 2 0 4 2 4 0 5 4 5 3 4 1 4 35 27 44 32 36 38 36 36 37 36 36 43 37 37 23 26 17 35 29 25 22 18 14 27 27 25 24 21 24 32 31 38 27 34 25 40 filter 再來 share 同樣的 weights W=
數學軟體應⽤ 218 記分板的⼤⼩ 注意⼀張原本 的圖, 經⼀個 ⼤⼩的 filter 卷積, 會得到差
不多⼤⼩ 記分板! ⽽且再來我們會討論到, 我們甚⾄ 更喜歡把記分板做成和原本圖的⼤ ⼩⼀樣。 那要是我們有 10 個記分板, 不就⼗ 倍的數據 !? 8 × 8 3 × 3 6 × 6 35 27 44 32 36 38 36 36 37 36 36 43 37 37 23 26 17 35 29 25 22 18 14 27 27 25 24 21 24 32 31 38 27 34 25 40
數學軟體應⽤ 219 記分板的⼤⼩ 1 0 0 0 0 1 0
0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 [ 0 1 0 0 1 0 0 1 0] Filter 1 0 0 0 0 0 0 0 0 0 圖 記分板 padding="valid" 如前述的掃描⽅式, 記分板 比原來圖略⼩, 但邊緣常會 掃不到 (像本例中的直線)。
數學軟體應⽤ 220 記分板的⼤⼩ 我們喜歡把原圖外⾯加圈 0, 讓記分板和原圖⼤⼩⼀ 樣! 注意這次有「看到」直線 了。 0
0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 [ 0 1 0 0 1 0 0 1 0] Filter 1 2 0 0 0 0 3 0 0 0 0 3 0 0 0 0 3 0 0 0 0 2 0 0 0 0 圖 記分板 padding="same" 外⾯加圈 0! 注意和原 圖⼀樣⼤!
數學軟體應⽤ 221 池化層 Pooling Layer 2 Max-Pooling Layer 最⼤池化層 決定區域特性
數學軟體應⽤ 222 設計池化層 設計⼀層池化層, 我們只需要... 決定多⼤的池化區域 (比如 ) 2 ×
2 ⽤哪種池化⽅式 (最常⽤取極⼤值) 1 2
數學軟體應⽤ 223 Max-Pooling 35 27 44 32 36 38 36
36 37 36 36 43 37 37 23 26 17 35 29 25 22 18 14 27 27 25 24 21 24 32 31 38 27 34 25 40 36 44 43 37 26 35 38 34 40 每區選出最⼤的!! 這樣記分板 瞬間變⼩!
數學軟體應⽤ 224 常⾒ CNN 設計架構 Conv Max- Pooling Dense Max-
Pooling Max- Pooling Conv Conv 可以不斷 覆卷積、池化、卷積、池化... 最後再 接全連結神經網路總結。
數學軟體應⽤ 225 要問題 Conv 層的 filter 要 越來越多還越來越 少呢?
數學軟體應⽤ 226 標準 CNN 應⽤ f 感染/未感染 Differentiation of Cytopathic
Effects Induced by Influenza Virus Infection Using Deep Convolutional Neural Networks Ting-En Wang, Tai-Ling Chao, Hsin-Tsuen Tsai, Pi-Han Lin, Yen-Lung Tsai, Sui-Yuan Chang 流感檢測。