PythonとKerasによるディープラーニング読書会_5章まとめ

PythonとKerasによるディープラーニング第5章 : コンピュータビジョンのためのディープラーニング 2019/8/22 【レベルと目的に応じて 2冊の本で学ぶ】DeepLearning勉強会#6@SOL大阪

Agenda • Part1(第1~4章)おさらい • 第5章「コンピュータビジョンのためのディープラーニング」 ◦ 畳込みニューラルネットワークの仕組み ◦ DataAugmentation ◦
転移学習(特徴抽出＆ファインチューニング ) ◦ 学習過程の可視化 • 余録(時間あれば適宜, なければスキップ) ◦ 第５章のJupyterNotebookで苦労したこと ◦ 個人的に感じた疑問点 ◦ その他フリーテーマ本セッションの目標：「PythonとKerasによるディープラーニング」第５章のポイントとなる概念を振り返りつつ、ディスカッションにより理解を深める。

Part1(第1~4章) おさらい

Remember Part1... • 第１章：Deep LearningとMachine Learningの概念 • 第２章：ニューラルネットワークの基礎 ◦ 『損失関数』『オプティマイザ』『学習とは訓練データと対応する目的値を対象に、
損失関数を最小化する NWパラメータの組み合わせを見つける事である』 etc… • 第３章：ニューラルネットワーク入門 ◦ Keras製NNで映画レビュー(二値分類),Reutersニュース(多クラス多ラベル分類 ), 住宅価格予測(回帰) • 第４章：機械学習の基礎 ◦ 評価方法(ホールドアウト法,k分割交差検証),特徴エンジニアリング ,正則化(l1,l2,Dropout), 『必要なモデルの大きさを突き止めるには、過学習に陥るモデルを開発する必要がある』 ◦ 詳しくは前回資料へ！出典:Deep Learning with Python /Francois Chollet(原著)

第5章「コンピュータビジョンのためのディープラーニング」

畳込みニューラルネットワークの仕組み DataAugmentation 転移学習(特徴抽出＆ファインチューニング ) 学習過程の可視化

畳込みニューラルネットワーク(Convolutional Neural Network) • 画像データに対しフィルタを使った特徴量抽出を行う事で、画像としての情報を失わずに特徴量を捉えることが出来る ◦ 全結合層のみのNNでは無視されていた「局所的なパターン」を取得できる
• 学習するパターンは移動不変である • パターンの空間階層を学習できるすごいぜ出典:Deep Learning with Python /Francois Chollet(原著) 要約元：Chapter.5 p124~127

畳込みニューラルネットワーク(Convolutional Neural Network) • ……文章とにらめっこするよりは、動画を色々見たほうが納得しやすいような気がします。 Google Cloud Japan:深層学習に特化したプロセッサ、Cloud
TPU の設計 Youtube- Convolutional Neural Network Visualization by Otavio Good

畳込みニューラルネットワーク(Convolutional Neural Network) 畳み込みの処理の流れと用語を確認します。 • 入力特徴マップに対し、ウィンドウ単位で特徴量を抽出する。 • 抽出された特徴量とフィルタで
内積を行う(カーネル計算)。 • ウィンドウは画像を網羅するようスライドしていく。 • 取得した特徴量を集積すると出力特徴マップになる。 • 出力特徴マップはカーネル演算の結果を踏まえ空間次元が変化し (畳込み)、カーネル計算の結果に応じたチャネルを持つすごいぜ出典:Deep Learning with Python /Francois Chollet(原著) 要約元：Chapter.5 p128~134

畳込みニューラルネットワーク(Convolutional Neural Network) 畳み込みの過程で使われる概念を確認します。 • 入力と同じ空間次元の出力特徴マップを取得したい場合は、パディングを行う。 ◦ 外縁部分の特徴量を捉えやすくなる。 •
ウィンドウ(フィルタ演算を行う単位 )のスライド幅をストライドという。 • プーリング演算により、出力特徴マップをダウンサイジングできる。 MaxPooling,AveragePooling等が実装可 ◦ 特徴マップの係数が減ることで汎化性能が高まる ◦ 深い層ほど入力が小さくなり、対しフィルタが捉える範囲が徐々に大きくなる。これが「パターンの空間階層」抽出に繋がる。出典:Deep Learning with Python /Francois Chollet(原著) 要約元：Chapter.5 p128~134

Data Augmentation：データ拡張 • CNNにおいて過学習の抑制に効果がある • フィルタを通じて取得した特徴量は移動不変性を持つ ◦ つまり歪めたり回転したデータであっても学習に利用できる
• KerasにおいてはImageDataGenerator()で実装可 • 実装は別途JupyterNotebook参照すごいぜ Deep Learning with Python 第5章のnotebook実行結果

畳込みニューラルネットワークの仕組み DataAugmentation 転移学習(特徴抽出＆ファインチューニング) 学習過程の可視化

転移学習：学習済modelを如何に再利用するかすごいぜ出典:VGG16 – Convolutional Network for Classiﬁcation and Detection(Neurohive)
ImageNet:http://imagenet.stanford.edu/synset?wnid=n02124075

• 特徴抽出：特徴量の抽出に、学習済の NWが抽出した特徴量を利用する。 • 手法１： ◦ 新しいデータを学習済NWにInput ◦
Outputを独立した全結合分類器に入力 ◦ DataAugmentationが使えない • 手法2： ◦ 学習済NWの分類器を削除して、新しい分類層を追加 ◦ 学習済部分のパラメータは凍結したまま、新しいデータを入力して分類器を訓練する ◦ DataAugmentationが使える • ファインチューニング：学習済NWの転移学習：特徴抽出要約元：Chapter.5 p149~159 出典:Deep Learning with Python /Francois Chollet(原著)

• ファインチューニング： ◦ 学習済のNWのうち、凍結されていた畳み込み層を一部解凍して再度学習を行う。 • 学習の流れとしては次の通り。 ◦ 訓練済NWの最後に、任意の分類層を新規作成する。
◦ 訓練済NWを凍結する。 ◦ 追加した分類層の訓練を行う。 ◦ 訓練済NWの任意の層も解凍する。 ◦ 解凍した層、分類層の訓練を同時に行う。 • 入力層側を凍結しておくことで「汎用的で再利用可能な特徴量」をエンコードできる（「パターンの空間階層」の活用）転移学習：ファインチューニング要約元：Chapter.5 p160~166 出典:Deep Learning with Python /Francois Chollet(原著)

学習過程の可視化テクニック(活性化したチャネルとフィルタ) Deep Learning with Python 第5章のnotebook実行結果 Input ↓ conv2d_5 (Conv2D)
(None, 148, 148, 32) max_pooling2d_5 (MaxPooling2 (None, 74, 74, 32) ↓ conv2d_6 (Conv2D) (None, 72, 72, 64) max_pooling2d_6 (MaxPooling2 (None, 36, 36, 64) ↓ conv2d_7 (Conv2D) (None, 34, 34, 128) max_pooling2d_7 (MaxPooling2 (None, 17, 17, 128) ↓ conv2d_8 (Conv2D) (None, 15, 15, 128) max_pooling2d_8 (MaxPooling2 (None, 7, 7, 128) ↓ flatten_2 (Flatten) (None, 6272) dropout_1 (Dropout) (None, 6272) dense_3 (Dense) (None, 512) dense_4 (Dense) (None, 1) ↓ Output ※点線部はイメージ。フィルタは厳密にはVGG-16のものであるため。要約元：Chapter.5 p166~181

学習過程の可視化テクニック(Class Activation Map) • Class Activation Map • 「入力画像によってどのチャネルが　活性化しているのか」
　　　　　　　　× 「そのクラスではどのチャネルが重要なのか」要約元：Chapter.5 p160~166

余録第５章のJupyterNotebookで苦労したこと個人的に感じた疑問点その他フリーテーマ

個人的に感じている疑問点 • 「CNNが学習するパターンは移動不変である」回転不変ではないということ？？？ ◦ 噂に聞いている「カプセルネットワーク」がこのAnswer？ • 転移学習∋データ拡張 ,ファインチューニング？ ◦ 広い意味では学習済モデルを再利用しているので「転移学習」としてまとめたが、厳密には？
• 何故、特徴抽出の手法１では DataAugmentationが使えないの？ ◦ 単純に学習データが増えただけの話で、一緒では？ • この本を読む限りKerasは分かりやすいが、世の「やってみた」だと chainerやPytorchをよく見る。そんなに違うの？ ◦ 悩む前に動かしたほうが早そうなので、とりあえずPytorchで同じようにVGG-16のファインチューニングやってみます……

Thanks. 連絡先: 会社名郵便番号都道府県市区町村番地 ※本資料で引用した画像ならびに引用文の著作権は、　全て出典の引用先に帰属します。

PythonとKerasによるディープラーニング読書会_5章まとめ

PythonとKerasによるディープラーニング読書会_5章まとめ

shinebalance

More Decks by shinebalance

Other Decks in Programming

Featured

Transcript

PythonとKerasによるディープラーニング第5章 : コンピュータビジョンのためのディープラーニング 2019/8/22 【レベルと目的に応じて 2冊の本で学ぶ】DeepLearning勉強会#6@SOL大阪

Agenda • Part1(第1~4章)おさらい • 第5章「コンピュータビジョンのためのディープラーニング」 ◦ 畳込みニューラルネットワークの仕組み ◦ DataAugmentation ◦

Part1(第1~4章) おさらい

Remember Part1... • 第１章：Deep LearningとMachine Learningの概念 • 第２章：ニューラルネットワークの基礎 ◦ 『損失関数』『オプティマイザ』『学習とは訓練データと対応する目的値を対象に、

第5章「コンピュータビジョンのためのディープラーニング」

畳込みニューラルネットワークの仕組み DataAugmentation 転移学習(特徴抽出＆ファインチューニング ) 学習過程の可視化

畳込みニューラルネットワーク(Convolutional Neural Network) • ……文章とにらめっこするよりは、動画を色々見たほうが納得しやすいような気がします。 Google Cloud Japan:深層学習に特化したプロセッサ、Cloud

畳込みニューラルネットワーク(Convolutional Neural Network) 畳み込みの処理の流れと用語を確認します。 • 入力特徴マップに対し、ウィンドウ単位で特徴量を抽出する。 • 抽出された特徴量とフィルタで

畳込みニューラルネットワークの仕組み DataAugmentation 転移学習(特徴抽出＆ファインチューニング ) 学習過程の可視化

Data Augmentation：データ拡張 • CNNにおいて過学習の抑制に効果がある • フィルタを通じて取得した特徴量は移動不変性を持つ ◦ つまり歪めたり回転したデータであっても学習に利用できる

畳込みニューラルネットワークの仕組み DataAugmentation 転移学習(特徴抽出＆ファインチューニング) 学習過程の可視化

転移学習：学習済modelを如何に再利用するかすごいぜ出典:VGG16 – Convolutional Network for Classiﬁcation and Detection(Neurohive)

• 特徴抽出：特徴量の抽出に、学習済の NWが抽出した特徴量を利用する。 • 手法１： ◦ 新しいデータを学習済NWにInput ◦

• ファインチューニング： ◦ 学習済のNWのうち、凍結されていた畳み込み層を一部解凍して再度学習を行う。 • 学習の流れとしては次の通り。 ◦ 訓練済NWの最後に、任意の分類層を新規作成する。

畳込みニューラルネットワークの仕組み DataAugmentation 転移学習(特徴抽出＆ファインチューニング ) 学習過程の可視化

学習過程の可視化テクニック(活性化したチャネルとフィルタ) Deep Learning with Python 第5章のnotebook実行結果 Input ↓ conv2d_5 (Conv2D)

学習過程の可視化テクニック(Class Activation Map) • Class Activation Map • 「入力画像によってどのチャネルが　活性化しているのか」

余録第５章のJupyterNotebookで苦労したこと個人的に感じた疑問点その他フリーテーマ

Thanks. 連絡先: 会社名郵便番号都道府県市区町村番地 ※本資料で引用した画像ならびに引用文の著作権は、　全て出典の引用先に帰属します。