Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
第1回ディープラーニング勉強会~画像処理編~
Search
EngineerCafe
February 05, 2022
Technology
0
71
第1回ディープラーニング勉強会~画像処理編~
EngineerCafe
February 05, 2022
Tweet
Share
More Decks by EngineerCafe
See All by EngineerCafe
イベントレポート_Hacktivation 続:生成AI時代におけるブロックチェーンの可能性
engineercafe
0
29
Docker はじめの一歩 #1 Dockerコンテナを動かしてみよう
engineercafe
0
29
git勉強会 (基本的なコマンドを覚えよう)
engineercafe
0
60
エンジニアのための論文ゆる輪読会 #1【 #ゆるりん 】
engineercafe
0
79
git勉強会(トラブルシューティングについて考えよう)
engineercafe
0
210
Unityの環境構築
engineercafe
0
47
git勉強会(ブランチを操作しよう)
engineercafe
0
250
GoogleツールでLINEBotを作ってみよう~GAS基礎編~
engineercafe
0
110
GoogleツールでLINEBotを作ってみよう~実践編~
engineercafe
0
160
Other Decks in Technology
See All in Technology
AIエージェント開発のノウハウと課題
pharma_x_tech
9
4.8k
LINEギフトにおけるバックエンド開発
lycorptech_jp
PRO
0
430
4th place solution Eedi - Mining Misconceptions in Mathematics
rist
0
150
OPENLOGI Company Profile for engineer
hr01
1
20k
Aurora PostgreSQLがCloudWatch Logsに 出力するログの課金を削減してみる #jawsdays2025
non97
1
250
2/18 Making Security Scale: メルカリが考えるセキュリティ戦略 - Coincheck x LayerX x Mercari
jsonf
0
260
ディスプレイ広告(Yahoo!広告・LINE広告)におけるバックエンド開発
lycorptech_jp
PRO
0
590
クラウド関連のインシデントケースを収集して見えてきたもの
lhazy
9
1.9k
アジャイルな開発チームでテスト戦略の話は誰がする? / Who Talks About Test Strategy?
ak1210
1
830
DevinでAI AWSエンジニア製造計画 序章 〜CDKを添えて〜/devin-load-to-aws-engineer
tomoki10
0
210
Introduction to OpenSearch Project - Search Engineering Tech Talk 2025 Winter
tkykenmt
2
220
フォーイット_エンジニア向け会社紹介資料_Forit_Company_Profile.pdf
forit_tech
1
1.7k
Featured
See All Featured
Building Your Own Lightsaber
phodgson
104
6.2k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Agile that works and the tools we love
rasmusluckow
328
21k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Documentation Writing (for coders)
carmenintech
68
4.6k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
Practical Orchestrator
shlominoach
186
10k
BBQ
matthewcrist
87
9.5k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
13
1k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
49k
RailsConf 2023
tenderlove
29
1k
Transcript
第1回ディープラーニング勉強会 ~画像処理編~
目次 • 自己紹介 • エンジニアカフェについて • 本の紹介 • 第0回のおさらい •
google colabolatory使ってみよう! • opencv使ってみよう!
自己紹介 • 岩永拓也 • 九州工業大学 情報工学部 4年 • 藤原研究室 アルゴリズム
• 趣味:ゲーム、読書、ボードゲーム、アマプラで映画 • エディタ:ATOM
エンジニアカフェについて • 成り立ち 旧日本生命保険株式会社九州支店→福岡市歴史資料館→エンジニアカフェ • 『エンジニアが集まる、活躍する、成長する街、福岡。』を掲げる福岡市の「エンジニアフレンド リーシティ福岡」活動の一環としてオープン • エンジニアがよりチャレンジやスキルの幅を広げることができるように誕生した施設 •
勉強会などのイベントも開催してるのでぜひ足を運んでみてください!
本の紹介 • 即戦力になるための ディープラーニング開発実践ハンズオン • [著]井上大樹、佐藤峻 • 価格:3280円(税抜) • リンク:
https://gihyo.jp/book/2021/978-4-297-11942-3
第0回のおさらい 1.1 機械学習と深層学習 1. 機械学習→「きかいてきにものごとのパターンを覚えさせること」 2. 深層学習→手法はパーセプトロン系統の進化であるディープニューラルネットワークをしたも の。教師ありに分類。 3. パーセプトロンの仕組み
4. ニューラルネットワーク →反応として活性化、活性化していないという極端な2択でなく、出力 する値の度合いで 測れるようにしたもの 5. 活性化関数の種類(シグモイド関数、ReLU関数)
第0回のおさらい 1.2 ニューラルネットワークの学習 • 順伝搬、誤差逆伝播の流れ • 損失曲線 →学習を各繰り返しのタイミングに、データ毎の損失の平均を計算し記録してできる 曲線。 •
過学習 →用意した学習用の入力データに対して完璧に反応できるがそれ以外のデータに対し ては正確な反 応が全くできない現象。 • オンライン学習、バッチ学習、ミニバッチ学習 • 損失関数、勾配降下方
第0回のおさらい 1.3 畳み込みニューラルネットワーク • ノード→各層における入力と出力 • FullConnection層(全結合層) →全ての入力ノードが全ての出力ノードと結びついてる層。 • Convolution層(畳み込み層)
→入力ノードいくつかのまとまりで圧縮し、特徴を抽出する層。 • カーネル、ストライド、畳み込み • パディング→入力データ全体の周囲にある擬似的なノード。
第0回のおさらい 1.3 畳み込みニューラルネットワーク • 3次元の画像データ
第0回のおさらい 1.3 畳み込みニューラルネットワーク • MAXPOOLING層/ AVERAGEPOOLING層(最大プーリング層/平均プーリング層) 図 MAXPooling層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • Upsampling層(アップサンプリング層) 図 Upsampling層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • TransposedConvolution層、Deconvolution層(逆畳み込み層) 図 TransposedConvolution層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • Dropout層(ドロップアウト層) 図 Dropout層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • Batchnormalization層(バッチ正規化層) 図 BatchNormalization層
第0回のおさらい 1.3 畳み込みニューラルネットワーク • CNN
第0回のおさらい 1.4 タスクとモデル • 分類(CLASSIFICATION) • 異常検知(ANOMALY DETECTION) • 物体検出(OBJECT
DETECTION) • 領域検出(SEGMENTATION)
google colabolatory使ってみよう! • google colabolatoryとは? 1. 教育機関や研究機関において機械学習の普及を目的としたgoogleの研究プロジェクトの一つ 2. Jupyter notebookを必要最低限の労力とコストで活用
3. googleのアカウントさえ持っていれば、すぐに機械学習プロジェクトを実施 4.高スペックなPCを必要としない https://su-gi-rx.com/archives/4670より引用
google colabolatory使ってみよう! • google driveで右クリックし、「その他」を押し、「google colabratory」にアクセス!
google colabolatory使ってみよう! • アクセスすると下のように出てくる
google colabolatory使ってみよう! • 1+1を入力し、Shiftキー+ Enterキーで実行!
opencv使ってみよう! • opencvとは? 1.インテルが開発・公開したオープンソースのコンピュータビジョン向けライブラリ向け 2.商用目的などで無料で使用できる 3.画像処理をはじめ、モーション解析、物体検出など幅広く使用されている。 https://ja.wikipedia.org/wiki/OpenCVより引用
opencv使ってみよう! • STEP1 opencvインストール ※10秒くらいかかる!
opencv使ってみよう! • STEP2 インストールされたか確認 • 結果
opencv使ってみよう! • STEP3 画像ファイルをアップロード! • コードを実行し、「ファイル選択」を押す
opencv使ってみよう! • 「sample01.png」の画像を選択し、開く→しばらく時間がかかる
opencv使ってみよう! • STEP4 画像を読み込もう! • 結果
opencv使ってみよう! • 画像処理のデータの仕組み →基本画像は縦と横とチャンネル(奥行き) の3次元のデータ。特にOPENCVで扱う画像は チャンネルがRED、GREEN、BLUEの3つになる。 この並びを略してRGBともいう。 チャンネル
opencv使ってみよう! • BGR色空間 →読み込んだデータが順に青、緑、赤の値が立方的に記述される色の空間 • RGB色空間 →読み込んだデータが順に赤、緑、青の値が立方的に記述される色の空間
opencv使ってみよう! • opencvはBGRなのでRGBに変換する必要がある! BGR RGB
opencv使ってみよう! • 変換しない場合の結果
opencv使ってみよう! • STEP5 画像の形を知ろう! 1446:画像の縦の大きさ 1094:画像の横の大きさ 3:チャンネルの大きさ (1446,1094,3):多次元配列の各次元の大きさ
opencv使ってみよう! • STEP6 画像を左右反転にしよう!
opencv使ってみよう! • STEP7 画像を赤にしよう!
opencv使ってみよう! • STEP8 画像を明るくしてみよう! uint8→uint16に変換
opencv使ってみよう! • STEP8 画像を明るくしてみよう! • 結果
opencv使ってみよう! • STEP9 画像をグレースケールにしてみよう!
opencv使ってみよう! • STEP9 画像をグレースケールにしてみよう! • 結果
opencv使ってみよう! • STEP10 画像をバイナリ化にしてみよう! グレーのボーダーライン
opencv使ってみよう! • STEP10 画像をバイナリ化にしてみよう! • 結果
opencv使ってみよう! • STEP10 画像を回転してみよう! 画像の大きさ 傾ける角度 画像の中心
opencv使ってみよう! • STEP10 画像を回転してみよう! • 結果
opencv使ってみよう! • STEP11 画像をぼかしてみよう!
opencv使ってみよう! • STEP12 画像を色域抽出してみよう! HSVの最大 HSVの最小
opencv使ってみよう! • HSV→色相、彩度、明度を合わせた言葉 • Opencvでは赤、青、緑の色相を扱う https://algorithm.joho.info/programming/python/opencv-rgb-to-hsv-color-space/を参照
opencv使ってみよう! • STEP12 画像を色域抽出してみよう! • 結果
opencv使ってみよう! • STEP13 画像を色域抽出してみよう! • cascadeファイルを読み込むため実行し、「ファイル選択」を押す
opencv使ってみよう! • STEP13 顔検出してみよう! • 「haarcascade_frontalface_default.xml」を選択し、開く
opencv使ってみよう! • STEP13 顔検出してみよう! 左上の座標 右下の座標 枠の色 枠の大きさ
opencv使ってみよう! • STEP13 顔検出してみよう! • 結果
opencv使ってみよう! • STEP13 顔検出してみよう!(猫の場合)
opencv使ってみよう! • STEP13 顔検出してみよう! • 結果
演習 • 画像を傾けたら顔認識されるか確認しよう! • 模範解答は後ほどconnpassで記載しますのでお願いします。 connpassのURL→https://engineercafe.connpass.com/event/223041/