Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
20171029_KantoCV_KIKUTA
yoppe
October 29, 2017
Technology
1
1.2k
20171029_KantoCV_KIKUTA
Talk at
https://kantocv.connpass.com/event/67984/
.
yoppe
October 29, 2017
Tweet
Share
More Decks by yoppe
See All by yoppe
20211023_recsys2021_paper_reading_YoheiKikuta
diracdiego
2
240
20201121_oldpaperreading_computing_machinery_and_intelligence
diracdiego
0
120
20200906_ACL2020_metric_for_ordinal_classification_YoheiKikuta
diracdiego
1
990
20191102_ACL2019_adversarial_examples_in_NLP_YoheiKIKUTA
diracdiego
2
1.3k
20190223_nlpaperchallenge_CV_4.3to5.5
diracdiego
2
680
20180701_CVPR2018_reading_YoheiKIKUTA
diracdiego
3
850
20180414_WSDM2018_reading_YoheiKIKUTA
diracdiego
0
630
20180306_NIPS2017_DeepLearning
diracdiego
4
5.6k
20180215_MLKitchen7_YoheiKIKUTA
diracdiego
0
230
Other Decks in Technology
See All in Technology
データをコネコネ!メール配信用データ生成の仕組み
kappezoro
0
110
年700万円損するサーバレスの 認可システムをご紹介します!!
higuuu
3
330
Djangoで組織とユーザーの権限管理をやってみよう #devio2022
seiichi1101
0
380
hey BOOK
heyinc
26
290k
第22回 MLOps 勉強会:みてねのMLOps事情
tonouchi510
0
290
eBPFで実現するコンテナランタイムセキュリティ / Container Runtime Security with eBPF
tobachi
PRO
5
1.6k
ECS on EC2 で Auto Scaling やってみる!
sayjoy
1
140
Trusted Web プロトタイプ
finengine
0
320
MySQL v5.7 勉強会/study-mysql-ver-5-7
andpad
0
2k
質の良い”カイゼン”の為の質の良い「振り返り」
shirayanagiryuji
0
120
2022 COSCUP - GKE Backend Cluster 除雷分享
brentchang
0
120
SBOMを利用したソフトウェアサプライチェーンの保護
masahiro331
1
190
Featured
See All Featured
Principles of Awesome APIs and How to Build Them.
keavy
113
15k
VelocityConf: Rendering Performance Case Studies
addyosmani
316
22k
Building Applications with DynamoDB
mza
84
4.8k
5 minutes of I Can Smell Your CMS
philhawksworth
196
18k
Six Lessons from altMBA
skipperchong
14
1.4k
Testing 201, or: Great Expectations
jmmastey
21
5.5k
How GitHub Uses GitHub to Build GitHub
holman
465
280k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_i
25
15k
For a Future-Friendly Web
brad_frost
166
7.5k
How To Stay Up To Date on Web Technology
chriscoyier
780
250k
Design by the Numbers
sachag
271
17k
The World Runs on Bad Software
bkeepers
PRO
57
5.4k
Transcript
がぞうのおしごと クックパッド株式会社 研究開発部 菊田 遥平 2017/10/29
自己紹介 • 名前 菊田 遥平(きくた ようへい) • 所属 研究開発部 •
肩書 リサーチサイエンティスト 博士(理学) • 専門 画像分析、推薦アルゴリズム • 好きな食べ物 焼き餃子、寿司、Dr Pepper @yohei_kikuta 2 / 18
今はこんな仕事してます 詳しくは https://github.com/yoheikikuta/resume をどうぞ • サービス開発 主に画像分析を用いたクックパッドのサービスの開発 • 研究開発業務 新規技術の開発や検証
論文執筆 • チームビルディング業務 体制作り 機械学習勉強会の開催 国内外の機械学習エンジニア選考 • 対外発表など 各種勉強会での発表 書籍執筆 ( http://www.shuwasystem.co.jp/products/7980html/4961.html ) 人工知能学会トップカンファレンス派遣レポータ 3 / 18
キャリア • 200903 東北大学理学部物理系卒業 • 201403 総合研究大学院大学素粒子原子核専攻修了 博士(理学) • 201404 会計系コンサルティングファーム入社 • 201406 先輩から貰った人工知能学会誌の連載で深層学習を知る
• 2015 機械学習系学会に初参加(人工知能学会発表、NIPS参加) • 2016 物体検出とかやりながら転職活動を始める • 201612 クックパッド入社 • 現在 画像分析を仕事の軸にしながら楽しく働いている 4 / 18
大学院生の時の知識 • Neural Network? Supervised Learning? 5 / 18 Ref:
http://2ch.sc/
大学院生の時の知識 • Python? 6 / 18 Ref: http://www.konami.jp/gs/game/mpo/index.html
大学院生の時の知識 • Simplify で頼むで! 7 / 18 Ref: http://www.wolfram.com/share.png
新卒就職活動 • そもそもなぜ就職しようと思ったか? 博士号を取得して”最低限”の研究はできた 研究者は業界が狭いし競争が苛烈で正直しんどそう 世の中でデータが重視されはじめて、それらをモデル化したい • どんなところを受けていたか? 良いチャンスだと思って色々受けまくった(商社とかも) ITスキル皆無だったのでエンジニア系職はあまり見れてなかった
データ分析がしたかったのでITコンサル系の会社に絞っていった • 新卒で入った会社 ゼロから始めて色々と勉強できたので良い会社だった コンサルっぽいことも学べた 8 / 18
転職の機運 • そもそもなぜ転職しようと思ったか? データ分析は面白いが自分の興味はもう少し技術寄りだった! → 分析というよりは機械学習に注力している会社に行ってみたい 機械学習に重要なのはデータだった! → 自社でデータとサービスを持っている会社に行ってみたい 機械学習に重要なのはエンジニアリングだった!
→ エンジニアリングに力を入れている会社に行ってみたい 自分に必要なのは高い自由度だった! → あまり規模が大きくなく自由度が高い会社に行ってみたい • どんなところを受けていたか? 上記条件を満たしていそうなところ あまり知り合いがいないので転職エージェントがメイン (SNSもあまりやっていなかった) 9 / 18
クックパッドにした理由 • 自社サービスと十分な量のデータ 画像(動画)、テキスト、ログ • 会社として技術力を重要視 経営層のレベルで機械学習に注力 • 規模と自由度の高さが自分の希望に近い 大きすぎず、やりたいことができそうで、対外発表も推奨
• 一緒に働く人がよさそう よさそうだった(直球) • 給与、福利厚生、副業OK 総合的に見ると他よりも良かった 10 / 18
クックパッドでの業務 • どんな感じで働いているか? フルフレックス( 8 hours / day ) で自由に働く
半期毎の目標を上長と摺合せて後は自分で頑張っていく {geekbot, issue, 定例MTG, 定例勉強会, 雑談}辺りで周りと情報共有 サービス化に向けて他部署と協働 • 分析環境は? ほぼ AWS のサービスを使っている 特に EC2 は slack で管理できる ( http://techlife.cookpad.com/entry/2017/10/26/174345 ) レポジトリに Dockerfile を含めて nvidia-docker を使って環境構築 データハンドリングも codenize しよう ( https://github.com/ayemos/akagi ) 11 / 18 研究開発部でよく使うもの 用途 EC2 GPU使った機械学習(主にP2) S3 画像データや学習済みモデル Redshift ログデータとか諸々 ECS ( https://github.com/eagletmt/hako ) サービスデプロイ時に使用
研究開発の人員 12 / 18 今日発表してる人 R/Dは得意分野の意味で 職務的には違いはない
クックパッドの画像分析 • 料理きろく 携帯端末中の画像から料理画像を抽出 画像の料理/非料理判別 登録写真数が1,000万枚を突破 https://info.cookpad.com/pr/news/press_2017_0928 • 技術的側面 CNNを用いた分類器の構築
確認不可能なテストデータに対応 詳しくは以下の記事を参照 http://techlife.cookpad.com/entry/2017/09/14/161756 13 / 18
クックパッドの画像分析 • カテゴリ分類 料理写真がどのレシピかを分類 android版がリリース (20171026時点) 色々なサービスに使っていきたい • 技術的側面 open
set problem で非常に難しい 普通の分類では誤認識が頻発 分類器の組み合わせ等で精度確保 14 / 18
クックパッドの画像分析 • その他の取り組んでいること ◦ 物体検出 ◦ 魅力度推定 ◦ 超解像 ◦
画像生成 ◦ 材料分類 ◦ 手順画像の抽出 ◦ 代表色の抽出 ◦ ... • 画像以外も色々やってます 自然言語処理、音声インターフェース、食文化、... 15 / 18
イベントやります 16 / 18
イベントやります 17 / 18 https://cookpad.connpass.com/event/70076/
We’re hiring!! https://info.cookpad.com/careers/jobs/careers/division/rd-department 18 / 18