Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
第1回ディープラーニング勉強会~画像処理編~
Search
iwanaga
September 25, 2021
Technology
0
260
第1回ディープラーニング勉強会~画像処理編~
iwanaga
September 25, 2021
Tweet
Share
More Decks by iwanaga
See All by iwanaga
第2回ディープラーニング勉強会~画像処理編~
ganchan11
0
300
第0回ディープラーニング勉強会(演習問題、訂正)
ganchan11
0
430
第0回ディープラーニング勉強会~画像処理編~資料
ganchan11
1
770
第3回python勉強会(解答)
ganchan11
0
340
第3回python勉強会~基礎編~
ganchan11
0
470
第2回python勉強会(解答編)
ganchan11
0
420
第2回python勉強会~基礎編~
ganchan11
0
600
第1回python勉強会~インストール編~
ganchan11
0
650
Other Decks in Technology
See All in Technology
社内お問い合わせBotの仕組みと学び
nish01
1
530
小学4年生夏休みの自由研究「ぼくと Copilot エージェント」
taichinakamura
0
590
Azure Well-Architected Framework入門
tomokusaba
1
350
神回のメカニズムと再現方法/Mechanisms and Playbook for Kamikai scrumat2025
moriyuya
4
700
OpenAI gpt-oss ファインチューニング入門
kmotohas
2
1.1k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
9.1k
AIツールでどこまでデザインを忠実に実装できるのか
oikon48
6
3.1k
【Oracle Cloud ウェビナー】クラウド導入に「専用クラウド」という選択肢、Oracle AlloyとOCI Dedicated Region とは
oracle4engineer
PRO
3
120
extension 現場で使えるXcodeショートカット一覧
ktombow
0
220
Adminaで実現するISMS/SOC2運用の効率化 〜 アカウント管理編 〜
shonansurvivors
4
430
Optuna DashboardにおけるPLaMo2連携機能の紹介 / PFN LLM セミナー
pfn
PRO
2
940
【Kaigi on Rails 事後勉強会LT】MeはどうしてGirlsに? 私とRubyを繋いだRail(s)
joyfrommasara
0
220
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
339
57k
A designer walks into a library…
pauljervisheath
209
24k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
127
53k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
The Pragmatic Product Professional
lauravandoore
36
6.9k
Agile that works and the tools we love
rasmusluckow
331
21k
How GitHub (no longer) Works
holman
315
140k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
358
30k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Practical Orchestrator
shlominoach
190
11k
Code Review Best Practice
trishagee
72
19k
Transcript
第1回ディープラーニング勉強会 ~画像処理編~
目次 • 自己紹介 • エンジニアカフェについて • 本の紹介 • 第0回のおさらい •
google colabolatory使ってみよう! • opencv使ってみよう!
自己紹介 • 岩永拓也 • 九州工業大学 情報工学部 4年 • 藤原研究室 アルゴリズム
• 趣味:ゲーム、読書、ボードゲーム、アマプラで映画 • エディタ:ATOM
エンジニアカフェについて • 成り立ち 旧日本生命保険株式会社九州支店→福岡市歴史資料館→エンジニアカフェ • 『エンジニアが集まる、活躍する、成長する街、福岡。』を掲げる福岡市の「エンジニアフレンド リーシティ福岡」活動の一環としてオープン • エンジニアがよりチャレンジやスキルの幅を広げることができるように誕生した施設 •
勉強会などのイベントも開催してるのでぜひ足を運んでみてください!
本の紹介 • 即戦力になるための ディープラーニング開発実践ハンズオン • [著]井上大樹、佐藤峻 • 価格:3280円(税抜) • リンク:
https://gihyo.jp/book/2021/978-4-297-11942-3
第0回のおさらい 1.1 機械学習と深層学習 1. 機械学習→「きかいてきにものごとのパターンを覚えさせること」 2. 深層学習→手法はパーセプトロン系統の進化であるディープニューラルネットワークをしたも の。教師ありに分類。 3. パーセプトロンの仕組み
4. ニューラルネットワーク →反応として活性化、活性化していないという極端な2択でなく、出力 する値の度合いで 測れるようにしたもの 5. 活性化関数の種類(シグモイド関数、ReLU関数)
第0回のおさらい 1.2 ニューラルネットワークの学習 • 順伝搬、誤差逆伝播の流れ • 損失曲線 →学習を各繰り返しのタイミングに、データ毎の損失の平均を計算し記録してできる 曲線。 •
過学習 →用意した学習用の入力データに対して完璧に反応できるがそれ以外のデータに対し ては正確な反 応が全くできない現象。 • オンライン学習、バッチ学習、ミニバッチ学習 • 損失関数、勾配降下方
第0回のおさらい 1.3 畳み込みニューラルネットワーク • ノード→各層における入力と出力 • FullConnection層(全結合層) →全ての入力ノードが全ての出力ノードと結びついてる層。 • Convolution層(畳み込み層)
→入力ノードいくつかのまとまりで圧縮し、特徴を抽出する層。 • カーネル、ストライド、畳み込み • パディング→入力データ全体の周囲にある擬似的なノード。
第0回のおさらい 1.3 畳み込みニューラルネットワーク • 3次元の画像データ
第0回のおさらい 1.3 畳み込みニューラルネットワーク • MAXPOOLING層/ AVERAGEPOOLING層(最大プーリング層/平均プーリング層) 図 MAXPooling層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • Upsampling層(アップサンプリング層) 図 Upsampling層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • TransposedConvolution層、Deconvolution層(逆畳み込み層) 図 TransposedConvolution層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • Dropout層(ドロップアウト層) 図 Dropout層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • Batchnormalization層(バッチ正規化層) 図 BatchNormalization層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • CNN
第0回のおさらい 1.4 タスクとモデル • 分類(CLASSIFICATION) • 異常検知(ANOMALY DETECTION) • 物体検出(OBJECT
DETECTION) • 領域検出(SEGMENTATION)
google colabolatory使ってみよう! • google colabolatoryとは? 1. 教育機関や研究機関において機械学習の普及を目的としたgoogleの研究プロジェクトの一つ 2. Jupyter notebookを必要最低限の労力とコストで活用
3. googleのアカウントさえ持っていれば、すぐに機械学習プロジェクトを実施 4.高スペックなPCを必要としない https://su-gi-rx.com/archives/4670より引用
google colabolatory使ってみよう! • google driveで右クリックし、「その他」を押し、「google colabratory」にアクセス!
google colabolatory使ってみよう! • アクセスすると下のように出てくる
google colabolatory使ってみよう! • 1+1を入力し、Shiftキー+ Enterキーで実行!
opencv使ってみよう! • opencvとは? 1.インテルが開発・公開したオープンソースのコンピュータビジョン向けライブラリ向け 2.商用目的などで無料で使用できる 3.画像処理をはじめ、モーション解析、物体検出など幅広く使用されている。 https://ja.wikipedia.org/wiki/OpenCVより引用
opencv使ってみよう! • STEP1 opencvインストール ※10秒くらいかかる!
opencv使ってみよう! • STEP2 インストールされたか確認 • 結果
opencv使ってみよう! • STEP3 画像ファイルをアップロード! • コードを実行し、「ファイル選択」を押す
opencv使ってみよう! • 「sample01.png」の画像を選択し、開く→しばらく時間がかかる
opencv使ってみよう! • STEP4 画像を読み込もう! • 結果
opencv使ってみよう! • 画像処理のデータの仕組み →基本画像は縦と横とチャンネル(奥行き) の3次元のデータ。特にOPENCVで扱う画像は チャンネルがRED、GREEN、BLUEの3つになる。 この並びを略してRGBともいう。 チャンネル
opencv使ってみよう! • BGR色空間 →読み込んだデータが順に青、緑、赤の値が立方的に記述される色の空間 • RGB色空間 →読み込んだデータが順に赤、緑、青の値が立方的に記述される色の空間
opencv使ってみよう! • opencvはBGRなのでRGBに変換する必要がある! BGR RGB
opencv使ってみよう! • 変換しない場合の結果
opencv使ってみよう! • STEP5 画像の形を知ろう! 1446:画像の縦の大きさ 1094:画像の横の大きさ 3:チャンネルの大きさ (1446,1094,3):多次元配列の各次元の大きさ
opencv使ってみよう! • STEP6 画像を左右反転にしよう!
opencv使ってみよう! • STEP7 画像を赤にしよう!
opencv使ってみよう! • STEP8 画像を明るくしてみよう! uint8→uint16に変換
opencv使ってみよう! • STEP8 画像を明るくしてみよう! • 結果
opencv使ってみよう! • STEP9 画像をグレースケールにしてみよう!
opencv使ってみよう! • STEP9 画像をグレースケールにしてみよう! • 結果
opencv使ってみよう! • STEP10 画像をバイナリ化にしてみよう! グレーのボーダーライン
opencv使ってみよう! • STEP10 画像をバイナリ化にしてみよう! • 結果
opencv使ってみよう! • STEP10 画像を回転してみよう! 画像の大きさ 傾ける角度 画像の中心
opencv使ってみよう! • STEP10 画像を回転してみよう! • 結果
opencv使ってみよう! • STEP11 画像をぼかしてみよう!
opencv使ってみよう! • STEP12 画像を色域抽出してみよう! HSVの最大 HSVの最小
opencv使ってみよう! • HSV→色相、彩度、明度を合わせた言葉 • Opencvでは赤、青、緑の色相を扱う https://algorithm.joho.info/programming/python/opencv-rgb-to-hsv-color-space/を参照
opencv使ってみよう! • STEP12 画像を色域抽出してみよう! • 結果
opencv使ってみよう! • STEP13 画像を色域抽出してみよう! • cascadeファイルを読み込むため実行し、「ファイル選択」を押す
opencv使ってみよう! • STEP13 顔検出してみよう! • 「haarcascade_frontalface_default.xml」を選択し、開く
opencv使ってみよう! • STEP13 顔検出してみよう! 左上の座標 右下の座標 枠の色 枠の大きさ
opencv使ってみよう! • STEP13 顔検出してみよう! • 結果
opencv使ってみよう! • STEP13 顔検出してみよう!(猫の場合)
opencv使ってみよう! • STEP13 顔検出してみよう! • 結果
演習 • 画像を傾けたら顔認識されるか確認しよう! • 模範解答は後ほどconnpassで記載しますのでお願いします。 connpassのURL→https://engineercafe.connpass.com/event/223041/