Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Tensorflowで"お姉さん"なのか"おばさん"なのかはっきりさせる

2b2add9e3015b44a405350d778043424?s=47 munaita_
August 04, 2017
550

 Tensorflowで"お姉さん"なのか"おばさん"なのかはっきりさせる

2b2add9e3015b44a405350d778043424?s=128

munaita_

August 04, 2017
Tweet

Transcript

  1. 2017/08/04 Tensorflowが目指すだれもができる機会学習 鈴木 省吾(@munaita_) “お姉さん”なのか“おばさん”なのか TensorFlowではっきりさせる

  2. 自己紹介 - フリーランス - 元渋谷C社 -> 市ヶ谷O社 - アドテク -

    サーバー、インフラ - Twitter: @munaita_ - 機械学習ははじめて
  3. お手柔らかに

  4. 突然ですが

  5. 何歳からおじさん・おばさん?

  6. 人による

  7. None
  8. 結構みんな気にしてる?

  9. TensorFlowで はっきりさせよう

  10. データ(カテゴリ?)の定義 定義: 検索エンジンで検索してひっかかった それっぽい画像 1. “お姉さん” 2. “おばさん” 3. “おばあちゃん”

    ※ モチベーション維持のため女性にしました
  11. Bing Search API - 十分な無料枠あり - APIのパラメータ豊富 - Face/Portraitなどのフィルタリングもあり -

    各カテゴリで1500件くらい取得 - スクリプト: https://github.com/shogo807/tensorflow_easy_tools/blob/master/bing_image_getter.py データの取得
  12. データの準備.1 検索結果のそれっぽくない画像をひたすら削除 - おばさんで検索↓ 男!! 草野さん! おばさん か? おばさん じゃない!

  13. データの準備.2 - フィルタ後の画像をOpenCVで顔の切り抜き - スクリプト: https://github.com/shogo807/tensorflow_easy_tools/blob/master/face_detector.py - 誤認識画像の削除

  14. 胸熱なフォルダの完成

  15. 準備できたデータ お姉さん - 訓練: 530枚 - テスト: 130枚 おばさん -

    訓練: 640枚 - テスト: 210枚 おばあちゃん - 訓練: 460枚 - テスト: 140枚
  16. モデル - Convolutional Neural Network - 難しかったのでkivatiumさんのブログを参考 - 参考記事: http://kivantium.hateblo.jp/entry/2015/11/18/233834

    - 作ったスクリプト: https://github.com/shogo807/tensorflow_easy_tools/blob/master/cnn_sample.py
  17. 結果 7割ちょいの精度

  18. 大変だった事1. 画像収集 - Google Search API - 無料では1日100クエリまで - 有料だと1日1000クエリで$5

    - 有料でも検索の100位以上はとれない!!! - ImageNet - カテゴリにすでに分類された大量の画像ある - 日本語のカテゴリがないので不採用 - Bing - 無料枠豊富 - フィルタリングとかもできる
  19. 大変だった事2. 画像準備 - 検索から取得したデータのフィルタリング - 仕分け作業やりすぎて謎の症状発症 - すれ違う人を分類してしまう おばさん? おばさん?

    おばさん?
  20. 課題 - データ集めと準備に苦労しすぎてモデルと向き合えな かった - 今度は広告データとかやりたい

  21. ありがとうございました Github: https://github.com/shogo807/tensorflow_easy_tools