Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
第1回ディープラーニング勉強会~画像処理編~
Search
EngineerCafe
February 05, 2022
Technology
0
66
第1回ディープラーニング勉強会~画像処理編~
EngineerCafe
February 05, 2022
Tweet
Share
More Decks by EngineerCafe
See All by EngineerCafe
git勉強会 (基本的なコマンドを覚えよう)
engineercafe
0
30
エンジニアのための論文ゆる輪読会 #1【 #ゆるりん 】
engineercafe
0
53
git勉強会(トラブルシューティングについて考えよう)
engineercafe
0
180
Unityの環境構築
engineercafe
0
29
git勉強会(ブランチを操作しよう)
engineercafe
0
210
GoogleツールでLINEBotを作ってみよう~GAS基礎編~
engineercafe
0
94
GoogleツールでLINEBotを作ってみよう~実践編~
engineercafe
0
140
アート×エンジニアMeeting(仮)#4 AI絵本 チーム1の絵本
engineercafe
0
46
アート×エンジニアMeeting(仮)#4 AI絵本 チーム2の絵本
engineercafe
0
44
Other Decks in Technology
See All in Technology
TypeScript、上達の瞬間
sadnessojisan
46
14k
SDN の Hype Cycle を一通り経験してみて思うこと / Going through the Hype Cycle of SDN
mshindo
1
120
誰も全体を知らない ~ ロールの垣根を超えて引き上げる開発生産性 / Boosting Development Productivity Across Roles
kakehashi
2
230
ノーコードデータ分析ツールで体験する時系列データ分析超入門
negi111111
0
430
開発生産性を上げながらビジネスも30倍成長させてきたチームの姿
kamina_zzz
2
1.7k
AGIについてChatGPTに聞いてみた
blueb
0
130
IBC 2024 動画技術関連レポート / IBC 2024 Report
cyberagentdevelopers
PRO
1
120
Amazon CloudWatch Network Monitor のススメ
yuki_ink
1
210
なぜ今 AI Agent なのか _近藤憲児
kenjikondobai
4
1.4k
アジャイルでの品質の進化 Agile in Motion vol.1/20241118 Hiroyuki Sato
shift_evolve
0
180
マルチモーダル / AI Agent / LLMOps 3つの技術トレンドで理解するLLMの今後の展望
hirosatogamo
37
13k
B2B SaaSから見た最近のC#/.NETの進化
sansantech
PRO
0
920
Featured
See All Featured
How GitHub (no longer) Works
holman
310
140k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
27
840
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
0
110
Building Your Own Lightsaber
phodgson
103
6.1k
Side Projects
sachag
452
42k
Fireside Chat
paigeccino
34
3k
Writing Fast Ruby
sferik
627
61k
Building Adaptive Systems
keathley
38
2.3k
Making the Leap to Tech Lead
cromwellryan
133
8.9k
Art, The Web, and Tiny UX
lynnandtonic
297
20k
Designing for Performance
lara
604
68k
5 minutes of I Can Smell Your CMS
philhawksworth
202
19k
Transcript
第1回ディープラーニング勉強会 ~画像処理編~
目次 • 自己紹介 • エンジニアカフェについて • 本の紹介 • 第0回のおさらい •
google colabolatory使ってみよう! • opencv使ってみよう!
自己紹介 • 岩永拓也 • 九州工業大学 情報工学部 4年 • 藤原研究室 アルゴリズム
• 趣味:ゲーム、読書、ボードゲーム、アマプラで映画 • エディタ:ATOM
エンジニアカフェについて • 成り立ち 旧日本生命保険株式会社九州支店→福岡市歴史資料館→エンジニアカフェ • 『エンジニアが集まる、活躍する、成長する街、福岡。』を掲げる福岡市の「エンジニアフレンド リーシティ福岡」活動の一環としてオープン • エンジニアがよりチャレンジやスキルの幅を広げることができるように誕生した施設 •
勉強会などのイベントも開催してるのでぜひ足を運んでみてください!
本の紹介 • 即戦力になるための ディープラーニング開発実践ハンズオン • [著]井上大樹、佐藤峻 • 価格:3280円(税抜) • リンク:
https://gihyo.jp/book/2021/978-4-297-11942-3
第0回のおさらい 1.1 機械学習と深層学習 1. 機械学習→「きかいてきにものごとのパターンを覚えさせること」 2. 深層学習→手法はパーセプトロン系統の進化であるディープニューラルネットワークをしたも の。教師ありに分類。 3. パーセプトロンの仕組み
4. ニューラルネットワーク →反応として活性化、活性化していないという極端な2択でなく、出力 する値の度合いで 測れるようにしたもの 5. 活性化関数の種類(シグモイド関数、ReLU関数)
第0回のおさらい 1.2 ニューラルネットワークの学習 • 順伝搬、誤差逆伝播の流れ • 損失曲線 →学習を各繰り返しのタイミングに、データ毎の損失の平均を計算し記録してできる 曲線。 •
過学習 →用意した学習用の入力データに対して完璧に反応できるがそれ以外のデータに対し ては正確な反 応が全くできない現象。 • オンライン学習、バッチ学習、ミニバッチ学習 • 損失関数、勾配降下方
第0回のおさらい 1.3 畳み込みニューラルネットワーク • ノード→各層における入力と出力 • FullConnection層(全結合層) →全ての入力ノードが全ての出力ノードと結びついてる層。 • Convolution層(畳み込み層)
→入力ノードいくつかのまとまりで圧縮し、特徴を抽出する層。 • カーネル、ストライド、畳み込み • パディング→入力データ全体の周囲にある擬似的なノード。
第0回のおさらい 1.3 畳み込みニューラルネットワーク • 3次元の画像データ
第0回のおさらい 1.3 畳み込みニューラルネットワーク • MAXPOOLING層/ AVERAGEPOOLING層(最大プーリング層/平均プーリング層) 図 MAXPooling層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • Upsampling層(アップサンプリング層) 図 Upsampling層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • TransposedConvolution層、Deconvolution層(逆畳み込み層) 図 TransposedConvolution層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • Dropout層(ドロップアウト層) 図 Dropout層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • Batchnormalization層(バッチ正規化層) 図 BatchNormalization層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • CNN
第0回のおさらい 1.4 タスクとモデル • 分類(CLASSIFICATION) • 異常検知(ANOMALY DETECTION) • 物体検出(OBJECT
DETECTION) • 領域検出(SEGMENTATION)
google colabolatory使ってみよう! • google colabolatoryとは? 1. 教育機関や研究機関において機械学習の普及を目的としたgoogleの研究プロジェクトの一つ 2. Jupyter notebookを必要最低限の労力とコストで活用
3. googleのアカウントさえ持っていれば、すぐに機械学習プロジェクトを実施 4.高スペックなPCを必要としない https://su-gi-rx.com/archives/4670より引用
google colabolatory使ってみよう! • google driveで右クリックし、「その他」を押し、「google colabratory」にアクセス!
google colabolatory使ってみよう! • アクセスすると下のように出てくる
google colabolatory使ってみよう! • 1+1を入力し、Shiftキー+ Enterキーで実行!
opencv使ってみよう! • opencvとは? 1.インテルが開発・公開したオープンソースのコンピュータビジョン向けライブラリ向け 2.商用目的などで無料で使用できる 3.画像処理をはじめ、モーション解析、物体検出など幅広く使用されている。 https://ja.wikipedia.org/wiki/OpenCVより引用
opencv使ってみよう! • STEP1 opencvインストール ※10秒くらいかかる!
opencv使ってみよう! • STEP2 インストールされたか確認 • 結果
opencv使ってみよう! • STEP3 画像ファイルをアップロード! • コードを実行し、「ファイル選択」を押す
opencv使ってみよう! • 「sample01.png」の画像を選択し、開く→しばらく時間がかかる
opencv使ってみよう! • STEP4 画像を読み込もう! • 結果
opencv使ってみよう! • 画像処理のデータの仕組み →基本画像は縦と横とチャンネル(奥行き) の3次元のデータ。特にOPENCVで扱う画像は チャンネルがRED、GREEN、BLUEの3つになる。 この並びを略してRGBともいう。 チャンネル
opencv使ってみよう! • BGR色空間 →読み込んだデータが順に青、緑、赤の値が立方的に記述される色の空間 • RGB色空間 →読み込んだデータが順に赤、緑、青の値が立方的に記述される色の空間
opencv使ってみよう! • opencvはBGRなのでRGBに変換する必要がある! BGR RGB
opencv使ってみよう! • 変換しない場合の結果
opencv使ってみよう! • STEP5 画像の形を知ろう! 1446:画像の縦の大きさ 1094:画像の横の大きさ 3:チャンネルの大きさ (1446,1094,3):多次元配列の各次元の大きさ
opencv使ってみよう! • STEP6 画像を左右反転にしよう!
opencv使ってみよう! • STEP7 画像を赤にしよう!
opencv使ってみよう! • STEP8 画像を明るくしてみよう! uint8→uint16に変換
opencv使ってみよう! • STEP8 画像を明るくしてみよう! • 結果
opencv使ってみよう! • STEP9 画像をグレースケールにしてみよう!
opencv使ってみよう! • STEP9 画像をグレースケールにしてみよう! • 結果
opencv使ってみよう! • STEP10 画像をバイナリ化にしてみよう! グレーのボーダーライン
opencv使ってみよう! • STEP10 画像をバイナリ化にしてみよう! • 結果
opencv使ってみよう! • STEP10 画像を回転してみよう! 画像の大きさ 傾ける角度 画像の中心
opencv使ってみよう! • STEP10 画像を回転してみよう! • 結果
opencv使ってみよう! • STEP11 画像をぼかしてみよう!
opencv使ってみよう! • STEP12 画像を色域抽出してみよう! HSVの最大 HSVの最小
opencv使ってみよう! • HSV→色相、彩度、明度を合わせた言葉 • Opencvでは赤、青、緑の色相を扱う https://algorithm.joho.info/programming/python/opencv-rgb-to-hsv-color-space/を参照
opencv使ってみよう! • STEP12 画像を色域抽出してみよう! • 結果
opencv使ってみよう! • STEP13 画像を色域抽出してみよう! • cascadeファイルを読み込むため実行し、「ファイル選択」を押す
opencv使ってみよう! • STEP13 顔検出してみよう! • 「haarcascade_frontalface_default.xml」を選択し、開く
opencv使ってみよう! • STEP13 顔検出してみよう! 左上の座標 右下の座標 枠の色 枠の大きさ
opencv使ってみよう! • STEP13 顔検出してみよう! • 結果
opencv使ってみよう! • STEP13 顔検出してみよう!(猫の場合)
opencv使ってみよう! • STEP13 顔検出してみよう! • 結果
演習 • 画像を傾けたら顔認識されるか確認しよう! • 模範解答は後ほどconnpassで記載しますのでお願いします。 connpassのURL→https://engineercafe.connpass.com/event/223041/