画像認識ハンズオン

自己紹介日本総合ビジネス専門学校 NIHON-CHUO Institution 2017.4- 合同会社4D Pocket 4D Pocket LLC.
2017.4- 石郷祐介 ISHIGO Yusuke Programmer

ࣾ ձ ʹ ؾ ͮ ͖ Λ ༩ ͑ Δ
ಓ ۩ Λ ։ ൃ ͠ · ͢

モバイル IoT ロボット人工知能 Web センサ音声認識音声合成機械学習 Beacon
オープンデータ Bot 異分野 × アイデア × 技術他社との研究開発を主とし、新たな価値を生み出すツールを作る

本日の流れ１. 画像処理ライブラリ「OpenCV」を使ってみる　・画像を読み込んで表示する　・ノイズ除去、画像反転、輪郭抽出、顔認識２. 「TensorFlow」と「Keras」で画像分類してみる３. 「IBM Watson」で画像解析してみる
　・風景写真の中から似た風景の写真を探す

Pythonの特徴サーバサイド言語として登場（P言語のひとつ）・AI（機械学習）・データ分析・IoT（Raspberry Pi）・ロボット（ROS）　等計算用ライブラリが豊富なため、高度な計算が必要なプログラムに多く使われている

開発環境 pyenv PythonやAnacondaをダウンロードしたり、バージョンを切り替えるためのツール Anaconda condaを含んだPythonとパッケージ（プラグイン）をまとめたもの（NumPy、scipy、Pandas、Jupyer、Scikit-learn等のパッケージ） Web系の言語には、バージョンを管理するツールが存在する conda Pythonパッケージをインストールできるツール
Pythonには、標準で同機能のpipがインストールされているが、 Anacondaを使う場合は、condaを使う（condaにないパッケージはpip）

言語の特徴 ① １．文末のセミコロンは不要 print(“Hello, world!”) ２．変数に型は必要ない（動的型付け＝ダックタイピング） hoge = “Hello, world!”
hoge = 123 print(“Hello, world!”); ◯ × String hoge = “Hello, world!” int hoge = 123 × ◯ If it walks like a duck and quacks like a duck, it must be a duck. もしそれがアヒルのように鳴き、アヒルのように歩いたら、それはアヒルである

言語の特徴 ② ３．カッコでなくインデントでまとまりを示す if hoge == ‘aaa’: print(‘Hello,’) print(‘world!’) if
hoge == ‘aaa’ { print(‘Hello,’) print(‘world!’) } ◯ × オフサイドルール

本日の流れ１. Pythonについて２. 開発環境の構築　・pyenv、anacondaのインストール３. ライブラリを使ってみる　① 標準ライブラリでWebサイトからスクレイピング
　② 「matplotlib」で取得したデータのグラフ表示する４. 基本的な機械学習アルゴリズムを自作してみる　① エクセルのデータを読み込んでグラフ表示する　② 「協調フィルタリング」の実装５. 「scikit-learn」で簡単に機械学習を実践してみる

OpenCVを使ってみる OpenCV 画像処理・解析のためのライブラリ conda install -c https://conda.anaconda.org/menpo opencv3 C/C++、Java、Python、MATLAB等、多数の言語に対応 Windows、macOS、Linux、Android、iOS等をサポート
機械学習の教師データのための画像整備のために必要

OpenCVを使ってみる ① import numpy as np import cv2 as cv
img = cv.imread(‘Lenna.png’) cv.imshow(‘ウィンドウ名’, img) cv.waitKey(0) cv.destroyAllWindows() 画像を読み込み表示する

OpenCVを使ってみる ① import numpy as np import cv2 as cv
img = cv.imread(‘Lenna.png’, cv.IMREAD_GRAYSCALE) cv.imshow(‘ウィンドウ名’, img) cv.imwrite(‘output.png’, img) cv.waitKey(0) cv.destroyAllWindows() グレースケールで画像を読み込み、保存するデータ量を減らすために、グレースケールにしてから画像認識する

OpenCVを使ってみる ② ノイズ除去（平滑化、スムージング）移動平均フィルタメディアン（中央値）フィルタ連続するデータにおいて、他値と乖離しているものを除去する手法

OpenCVを使ってみる ② 移動平均フィルタ 20 0 13 11 9 10 12
8 7 (20 + 12 + 8 + 13 + 7 + 11 + 9 + 10) / 8 = 11.25 20 11 13 11 9 10 12 8 7 補正するピクセルの周辺のピクセルの平均をとるノイズや境界線の影響を受けて全体的にぼやける

OpenCVを使ってみる ② メディアンフィルタ 20 0 13 11 9 10 12
8 7 7、8、9、10、11、12、13、20の中央値→10 20 10 13 11 9 10 12 8 7 補正するピクセルの周辺のピクセルの中央値を適用するノイズや境界線の影響を受けにくいので、ノイズのみを除去しやすい

OpenCVを使ってみる ③ ディープラーニング等の教師データとして反転した画像を追加する画像反転

OpenCVを使ってみる ④ 輪郭抽出（物体認識）

OpenCVを使ってみる ⑤ 顔認識 OpenCVの標準の学習データを使って顔認識を行う学習データを更新することで、認識物を変えたり、精度を向上できる

TensorFlowとKeras TensorFlow Googleが開発しているオープンソースの機械学習ライブラリディープラーニングに対応している Keras Python用のニューラルネットワークライブラリ TensorFlowをバックエンドとして、同様の機能を完結な書き方で実現できる

ディープラーニング ① 人間の神経細胞の繋がりをモデルにした機械学習手法パーセプトロン、ニューラルネットワーク特徴A 特徴B 特徴C 閾値結果（0 or
1）シグモイドニューロンの場合は0.0〜1.0の間 w1 w2 w3 １．学習したい物事を複数の特徴に分ける２．特徴の重要性を重み（w1、w2、w3）として設定する３．入力の合計値が、閾値を超えたら、1を返す

ディープラーニング ② パーセプトロンを層にしたもの多層パーセプトロン（入力層、隠れ層、出力層が3つのもの）入力層出力層隠れ層重み付けが大変！

ディープラーニング ③ パーセプトロンを層にしたもの多層パーセプトロン（入力層、隠れ層、出力層が3つのもの）入力層出力層隠れ層誤差逆伝播法（バックプロパゲーション）誤差からパラメータを調整する手法重み付けが大変！
誤差重み調整

ディープラーニング ④ 入力層、隠れ層、出力層が4つ以上のもので、誤差逆伝播法の問題点を解決したものディープラーニング入力層出力層隠れ層 … TensorFlow
Playground http://playground.tensorﬂow.org/

「IBM Watson」で画像解析してみるあい旅っと写真の風景に近い国内の風景を探し出し、マップを表示するアプリ

「IBM Watson」で画像解析してみる Bluemix Watson API

画像認識ハンズオン

画像認識ハンズオン

ISHIGO Yusuke PRO

More Decks by ISHIGO Yusuke

Other Decks in Technology

Featured

Transcript

自己紹介日本総合ビジネス専門学校 NIHON-CHUO Institution 2017.4- 合同会社4D Pocket 4D Pocket LLC.

ࣾ ձ ʹ ؾ ͮ ͖ Λ ༩ ͑ Δ

モバイル IoT ロボット人工知能 Web センサ音声認識音声合成機械学習 Beacon

本日の流れ１. 画像処理ライブラリ「OpenCV」を使ってみる　・画像を読み込んで表示する　・ノイズ除去、画像反転、輪郭抽出、顔認識２. 「TensorFlow」と「Keras」で画像分類してみる３. 「IBM Watson」で画像解析してみる

Pythonの特徴サーバサイド言語として登場（P言語のひとつ）・AI（機械学習）・データ分析・IoT（Raspberry Pi）・ロボット（ROS）　等計算用ライブラリが豊富なため、高度な計算が必要なプログラムに多く使われている

言語の特徴 ① １．文末のセミコロンは不要 print(“Hello, world!”) ２．変数に型は必要ない（動的型付け＝ダックタイピング） hoge = “Hello, world!”

言語の特徴 ② ３．カッコでなくインデントでまとまりを示す if hoge == ‘aaa’: print(‘Hello,’) print(‘world!’) if

本日の流れ１. Pythonについて２. 開発環境の構築　・pyenv、anacondaのインストール３. ライブラリを使ってみる　① 標準ライブラリでWebサイトからスクレイピング

OpenCVを使ってみる OpenCV 画像処理・解析のためのライブラリ conda install -c https://conda.anaconda.org/menpo opencv3 C/C++、Java、Python、MATLAB等、多数の言語に対応 Windows、macOS、Linux、Android、iOS等をサポート

OpenCVを使ってみる ① import numpy as np import cv2 as cv

OpenCVを使ってみる ① import numpy as np import cv2 as cv

OpenCVを使ってみる ② ノイズ除去（平滑化、スムージング）移動平均フィルタメディアン（中央値）フィルタ連続するデータにおいて、他値と乖離しているものを除去する手法

OpenCVを使ってみる ② 移動平均フィルタ 20 0 13 11 9 10 12

OpenCVを使ってみる ② メディアンフィルタ 20 0 13 11 9 10 12

OpenCVを使ってみる ③ ディープラーニング等の教師データとして反転した画像を追加する画像反転

OpenCVを使ってみる ④ 輪郭抽出（物体認識）

OpenCVを使ってみる ⑤ 顔認識 OpenCVの標準の学習データを使って顔認識を行う学習データを更新することで、認識物を変えたり、精度を向上できる

本日の流れ１. 画像処理ライブラリ「OpenCV」を使ってみる　・画像を読み込んで表示する　・ノイズ除去、画像反転、輪郭抽出、顔認識２. 「TensorFlow」と「Keras」で画像分類してみる３. 「IBM Watson」で画像解析してみる

ディープラーニング ① 人間の神経細胞の繋がりをモデルにした機械学習手法パーセプトロン、ニューラルネットワーク特徴A 特徴B 特徴C 閾値結果（0 or

ディープラーニング ② パーセプトロンを層にしたもの多層パーセプトロン（入力層、隠れ層、出力層が3つのもの）入力層出力層隠れ層重み付けが大変！

ディープラーニング ④ 入力層、隠れ層、出力層が4つ以上のもので、誤差逆伝播法の問題点を解決したものディープラーニング入力層出力層隠れ層 … TensorFlow

本日の流れ１. 画像処理ライブラリ「OpenCV」を使ってみる　・画像を読み込んで表示する　・ノイズ除去、画像反転、輪郭抽出、顔認識２. 「TensorFlow」と「Keras」で画像分類してみる３. 「IBM Watson」で画像解析してみる

「IBM Watson」で画像解析してみるあい旅っと写真の風景に近い国内の風景を探し出し、マップを表示するアプリ

「IBM Watson」で画像解析してみるあい旅っと写真の風景に近い国内の風景を探し出し、マップを表示するアプリ

「IBM Watson」で画像解析してみる Bluemix Watson API