20170216_TechKitchen_FoodImage_Classification
by
yoppe
×
Copy
Open
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Slide 1
Slide 1 text
Food Image Object Detection and Classification Challenges and Solutions
Slide 2
Slide 2 text
Part 2: classification
Slide 3
Slide 3 text
自己紹介 研究開発部 菊田遥平 好きな食べ物 ・焼き餃子 ・寿司 ・ハンバーグ 好きな確率分布 ・ポアソン分布
Slide 4
Slide 4 text
サービス紹介:料理きろく 41,000人以上のユーザー 850,000枚以上の料理写真 (20170207現在) ・Deep Learningを使った初プロダクト ・端末中の画像から料理画像を自動抽出 ・自分の料理の記録を一望できる ・201612に全体公開
Slide 5
Slide 5 text
アーキテクチャ(概略) Client API server DB 料理/非料理 判別 非同期な画像処理 Android, iOS EC2 SQS S3 enqueue dequeue images results
Slide 6
Slide 6 text
料理/非料理 判別問題 赤ちゃんの画像はパブリックドメインの画像から取得 http://www.publicdomainpictures.net/
Slide 7
Slide 7 text
簡単な問題?
Slide 8
Slide 8 text
簡単な問題? 否! ● 誤判別を引き起こしやすい画像の存在 → 画像は多様性が大きく判別が難しいものも多い ● 適合率と再現率のバランス → サービス上の有用性と危険性を考慮する必要性がある ● 真のデータ分布にアクセス不可 → 規約上ユーザがアップした画像をチェックすることができない ● 対象は動的に変化し続けるもの → ユーザが増えれば画像も増え、その傾向も変わっていくもの
Slide 9
Slide 9 text
最初のモデル AlexNet-like model ● 迅速なサービスデプロイのために選択 → 研究開発部ができて間もない頃にプロジェクトがスタート ● シンプルな料理/非料理判定モデル → 料理と非料理の2クラス分類として問題を定式化 ● 適合率は悪くないが、再現率は良くない → 非料理を料理と判断される方が問題が多いためにこのように調整
Slide 10
Slide 10 text
間違えやすい画像の存在 非料理 ☓ 料理 ☓ AlexNet-like model
Slide 11
Slide 11 text
モデル改善のアプローチ ● より高度なモデルを検証 → CNNの発展をキャッチアップして、その性能を検証 ● 多クラス問題への拡張 → 間違えやすいクラスに対する明示的な対処として、クラスを追加 ● テストデータセットの拡充 → ローカル環境での性能判断を正確にするために、データを拡充 ● 他のアプローチの併用 → 性能向上の可能性を追求するために、物体検出などの併用も模索 ● ...
Slide 12
Slide 12 text
より高度なモデルを検証 様々なモデルを比較 ● Network In Network ● VGG19 ● ResNet ● Inception v3 ● ...
Slide 13
Slide 13 text
より高度なモデルを検証 ● Network In Network : https://arxiv.org/abs/1312.4400 ・畳み込み層として多層パーセプトロンを採用 ・全結合層でなくglobal poolingを用いることで、少ないパラメタでロバストなモデルを実現 ・精度は他のstate-of-the-artには劣るが、サイズが小さく優秀なモデルが作れる
Slide 14
Slide 14 text
より高度なモデルを検証 ● VGG19 : https://arxiv.org/abs/1409.1556 ・基本的な要素で構成されたモデル ・単純ではあるが高い性能を発揮 ・モデルサイズは比較的大きい
Slide 15
Slide 15 text
より高度なモデルを検証 ● ResNet : https://arxiv.org/abs/1512.03385 ・ネットワークのパスを分岐して、残差を学習するResidual unitを導入 ・誤差信号が2つのパスの組み合わせとなるため消失しづらく、深い構造を効率的に学習 ・高い精度を発揮(2015年のILSVRCで優勝)
Slide 16
Slide 16 text
より高度なモデルを検証 ● Inception v3 : https://arxiv.org/abs/1512.00567 ・複数フィルタを並列に適用 異なるサイズとパターンを検出 ・高い精度を発揮 前身は2014年のILSVRCで優勝 ・様々な亜種が提案 Inception-ResNet など
Slide 17
Slide 17 text
多クラス問題への拡張 food ≠ non-food ● どちらも限られたデータから学習したもの → 全集合は扱えないため、非料理は非料理らしさをデータから学習 → 学習した非料理らしさに当てはまらないデータは予測が難しい ● 判定が微妙なもの適切なクラスに導きたい → 2値判別ではうまくいかなかったものを新しいクラスとして扱う ● 間違えやすい赤ちゃんクラスなどを追加 → 試行錯誤の結果として発見した間違えやすいクラスを追加
Slide 18
Slide 18 text
多クラス問題への拡張 food ≠ non-food 確率密度 画像の種類 料理 非料理 非料理1 非料理2 料理 2クラスでは判定が難しい非料理画像を追加クラスでカバー
Slide 19
Slide 19 text
モデルの改善 料理 ◯ 非料理 ◯ Inception v3-like model + 多クラス学習
Slide 20
Slide 20 text
一番大事なことは継続 ● トライ&エラーを繰り返し続ける ● 発信し続ける ● 状況の変化に適応し続ける柔軟性を持つ 様々なチャレンジを継続しています!
Slide 21
Slide 21 text
告知
Slide 22
Slide 22 text
AIチャレンジコンテスト ● https://deepanalytics.jp/compe/31 ● 先端的な人工知能技術開発を競う場 ● 料理画像の画像認識アルゴリズムの作成 ILSVRCにもある物体検出と分類の2タスク クックパッドは料理画像データを提供 ● 主催 人工知能技術戦略会議、内閣府、文科省
Slide 23
Slide 23 text
AIチャレンジコンテスト 締切 : 20170309 物体検出タスク - 20170208時点
Slide 24
Slide 24 text
AIチャレンジコンテスト 締切 : 20170309 分類タスク - 20170208時点
Slide 25
Slide 25 text
質問等ありましたら 下記までお問い合わせ下さい
[email protected]