Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SSDを用いた食材リアルタイム検知 &レシピレコメンドシステム
Search
hayataka
April 07, 2024
Science
0
10
SSDを用いた食材リアルタイム検知 &レシピレコメンドシステム
東大・松尾研主宰「Deep Learning 基礎講座2018」での最終課題発表ポスター
https://deeplearning.jp/lectures/dlb2018/
hayataka
April 07, 2024
Tweet
Share
More Decks by hayataka
See All by hayataka
どうすれば私たちは、R&D活動の計量・評価を 健全に活用できるだろうか?
hayataka88
0
11
IKIGAI BOX やさしさでつながる、スキル、お仕事マッチング FOR 介護施設入居者
hayataka88
0
15
Science of Scienceおよび科学計量学に関する研究論文の俯瞰可視化_LT版
hayataka88
0
490
Science of Scienceおよび科学計量学に関する研究論文の俯瞰可視化_ポスター版
hayataka88
0
53
東大・松尾研主催 LLM Summer 2023 コンペ解法 (11位 – 20位枠での優秀賞)
hayataka88
0
180
生成AIと一緒につくる知財図鑑Podcast
hayataka88
0
150
ChatGPTとNoteableによる科学技術情報分析
hayataka88
3
3.3k
「俯瞰」可視化が情報探索・分析を変える
hayataka88
4
1.4k
好奇心に基づく研究推進や社会成果還元を見据えたデータ活用 スタートアップ情報解析と研究者ネットワーク解析
hayataka88
0
180
Other Decks in Science
See All in Science
汎用原子シミュレータMatlantis のご紹介
matlantis
0
130
OptimizationNight~機械学習と数理最適化の融合~
hidenari
0
310
Ph.D. defense "Convex Manifold Approximation for Tensors"
gkazunii
0
180
Machine Learning for Materials (Lecture 3)
aronwalsh
0
840
O ChatGPT e outras IAs vão mudar toda a pesquisa científica
cardososampaio
0
180
遺伝子発現プロファイルに基づく新しい薬物間相互作用予測法
tagtag
0
100
JSol'Ex : solar image processing in Java
melix
0
250
2023-10-03-FOGBoston
lcolladotor
0
180
Onsager代数とその周辺 / Onsager algebra tsudoi
usamik26
0
390
『データ可視化学入門』を PythonからRに翻訳した話
bob3bob3
1
370
BigQueryで参加するレコメンドコンペ / bq-recommend-competition-kaggle-meetup-tokyo-2023
shimacos
1
1.3k
スポーツメトリクス設計に対比較法を使いまくる / Sports metrics design using pairwise comparison method (spoana#14)
konakalab
1
720
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
11
1k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
19
6.9k
What the flash - Photography Introduction
edds
64
11k
The Cost Of JavaScript in 2023
addyosmani
20
3.9k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
33
6k
Teambox: Starting and Learning
jrom
128
8.4k
The Cult of Friendly URLs
andyhume
74
5.7k
Docker and Python
trallard
35
2.7k
Rails Girls Zürich Keynote
gr2m
91
13k
Writing Fast Ruby
sferik
622
60k
Embracing the Ebb and Flow
colly
80
4.2k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
79
43k
Transcript
SSDによる リアルタイム検知 1. 目的 食材写真からレシピを推薦するサービスは数多くあるが、画像をキレイに撮影 するのは面倒。冷蔵庫の中身をそのまま動画スキャンできれば便利なのでは ないか。 1 レシピレコメンドアプリ例(ライオン) ref)
https://reed.lion.co.jp/search/ 動画撮影による食材検知&レシピ推薦 2. アプローチ 3. SSDモデル構築 食材をキレイに撮影する手間を省くため、①の冷蔵庫内動画からリアルタイムに検 知にするSSDモデル構築に注力した。なお、②は簡易的に実施した。 冷蔵庫の中身 動画撮影 レシピAPI※から 検知した食材を含む レシピをランダム取得 1 2 R-CNN Fast(er) R-CNN YOLO You Only Look Once SSD Single Shot MultiBox Detector Single Stage 直接各物体のクラス・位 置推定 高速 多オブジェクト可能 Aと同等の精度 Bより高速 多オブジェクト可能 Two Stage 物体候補推定 →候補毎に物体クラス・位 置推定 先駆け的な存在 遅い 特徴 タイプ アルゴリズム A B C ❖ ディープラーニング系物体検知アルゴリズム比較 ❖ フロー メンバー各人が自身の冷蔵庫の中身をスマホで動画撮影し、アノテーション ツールを使って、学習データを作成(計1030枚)。 1 2 3 4 データ準備 モデル学習 評価&考察 改善案 • labeling_for_object_detec tion:Processingを用い たツール。Githubで公 開。 • VoTT:マイクロソフト製。 動画から直接アノテー ション可能。出力データ に不要データが含まれ る等、一部使いにくい部 分がある。 アノテーションツール 学習データ内訳 Github(https://github.com/rykov8/ssd_keras) に公開されているssd_kerasを利 用してSSDモデルを学習。 • 学習・検証に利用していないテストデータにおいて、正解と推定結果で、bboxのIoU(重なり度合い)が 0.5以上であれば、ラベル比較をする。その他はBackgroundと認識されたと仮定。下記の混合行列は、 各正解ラベルがどのように推定されたか割合を示す。 • 課題①:少し似ているものはデータが多いものに引っ張られる傾向(Apple→Tomato、Enoki→しめじ、 Greenpepper→Aspara等) • 課題:②Cabbage→Shimeji、Spinach→Cucumberと包装等によって誤認識がされる可能性 • 課題:③そもそもBackgroundと認識されている場合が多く、領域推定に課題 • 食材 件数 Tomato 593 Carrot 559 Pumpkin 232 Spinach 188 Shimeji 165 Asparagus 142 Apple 135 Egg 122 Turnip 114 Cucumber 84 Broccoli 80 食材 件数 Leek 9 Pork 6 Chicken 5 Firefly_Squid 5 Squid 5 Beaf 4 Ume 4 食材 件数 Mushroom 72 Celery 71 Onion 55 Beansprouls 48 Enoki 47 Greenpepper 43 Daikon 39 Paprika 28 Cabbage 23 Milk 15 Orange 10 学習時 • アーキテクチャ: SSD300 • 損失関数: 位置特定誤差 (Smooth L1)と 確信度誤差 (Softmax)の重み付き和 • 最適化: Adam • バッチサイズ: 4 Configuration 損失推移 ※ EDAMAN Recipe Search API https://www.edamam.com/ データ加工 モデル工夫 新データ& モデル 観点 A-1. 学習データのバイアス低減 A-2. 高周波ノイズフィルタ(包装、ラップ等)【課題①】 A-3. 包装有無の両学習データの準備【課題②】 A-4. カット済み食材の学習(GANによる画像生成等) B-1. 他DL物体検知アルゴリズム(YOLO等) B-2. ハイパーパラメータ最適化 C-1. パッケージ文字認識による食材検知 C-2. 3次元形状の認識【課題③】 C-3. 食材の個数・量推定 C-4. 複数検知モデルのアンサンブル 改善案 A B C 評価&考察を踏まえつつ、下記のような改善案が考えられる。 SSDを用いた食材リアルタイム検知 &レシピレコメンドシステム チーム7 Deep Learning Day 2019.3.30 ※ 黄:正解、赤:誤認識割合No.1、青:誤認識割合No.2 検証時 正解\推定 Backgr ound Aspara gus Apple Broccol i Carrot Cabbag e Cucmb er Enoki Mushro om Onion Spinach Shimeji Tomato Apple 32 0 8 0 0 0 0 0 0 0 0 0 60 Carrot 33 0 0 0 67 0 0 0 0 0 0 0 0 Cabbage 35 12 0 6 0 12 0 6 0 0 0 29 0 Enoki 50 0 0 0 0 17 0 0 17 0 0 17 0 Greenpepper 87 13 0 0 0 0 0 0 0 0 0 0 0 Onion 56 0 0 0 0 0 0 11 0 28 0 6 0 Spinach 32 5 0 0 0 0 39 0 0 0 24 0 0 Tomato 41 0 0 0 0 0 0 0 0 0 0 0 59