Slide 1

Slide 1 text

がぞうのおしごと クックパッド株式会社 研究開発部 菊田 遥平 2017/10/29

Slide 2

Slide 2 text

自己紹介 ● 名前 菊田 遥平(きくた ようへい) ● 所属 研究開発部 ● 肩書 リサーチサイエンティスト 博士(理学) ● 専門 画像分析、推薦アルゴリズム ● 好きな食べ物 焼き餃子、寿司、Dr Pepper @yohei_kikuta 2 / 18

Slide 3

Slide 3 text

今はこんな仕事してます 詳しくは https://github.com/yoheikikuta/resume をどうぞ ● サービス開発 主に画像分析を用いたクックパッドのサービスの開発 ● 研究開発業務 新規技術の開発や検証 論文執筆 ● チームビルディング業務 体制作り 機械学習勉強会の開催 国内外の機械学習エンジニア選考 ● 対外発表など 各種勉強会での発表 書籍執筆 ( http://www.shuwasystem.co.jp/products/7980html/4961.html ) 人工知能学会トップカンファレンス派遣レポータ 3 / 18

Slide 4

Slide 4 text

キャリア ● 200903 東北大学理学部物理系卒業 ● 201403 総合研究大学院大学素粒子原子核専攻修了 博士(理学) ● 201404 会計系コンサルティングファーム入社 ● 201406 先輩から貰った人工知能学会誌の連載で深層学習を知る ● 2015 機械学習系学会に初参加(人工知能学会発表、NIPS参加) ● 2016 物体検出とかやりながら転職活動を始める ● 201612 クックパッド入社 ● 現在 画像分析を仕事の軸にしながら楽しく働いている 4 / 18

Slide 5

Slide 5 text

大学院生の時の知識 ● Neural Network? Supervised Learning? 5 / 18 Ref: http://2ch.sc/

Slide 6

Slide 6 text

大学院生の時の知識 ● Python? 6 / 18 Ref: http://www.konami.jp/gs/game/mpo/index.html

Slide 7

Slide 7 text

大学院生の時の知識 ● Simplify で頼むで! 7 / 18 Ref: http://www.wolfram.com/share.png

Slide 8

Slide 8 text

新卒就職活動 ● そもそもなぜ就職しようと思ったか? 博士号を取得して”最低限”の研究はできた 研究者は業界が狭いし競争が苛烈で正直しんどそう 世の中でデータが重視されはじめて、それらをモデル化したい ● どんなところを受けていたか? 良いチャンスだと思って色々受けまくった(商社とかも) ITスキル皆無だったのでエンジニア系職はあまり見れてなかった データ分析がしたかったのでITコンサル系の会社に絞っていった ● 新卒で入った会社 ゼロから始めて色々と勉強できたので良い会社だった コンサルっぽいことも学べた 8 / 18

Slide 9

Slide 9 text

転職の機運 ● そもそもなぜ転職しようと思ったか? データ分析は面白いが自分の興味はもう少し技術寄りだった! → 分析というよりは機械学習に注力している会社に行ってみたい 機械学習に重要なのはデータだった! → 自社でデータとサービスを持っている会社に行ってみたい 機械学習に重要なのはエンジニアリングだった! → エンジニアリングに力を入れている会社に行ってみたい 自分に必要なのは高い自由度だった! → あまり規模が大きくなく自由度が高い会社に行ってみたい ● どんなところを受けていたか? 上記条件を満たしていそうなところ あまり知り合いがいないので転職エージェントがメイン (SNSもあまりやっていなかった) 9 / 18

Slide 10

Slide 10 text

クックパッドにした理由 ● 自社サービスと十分な量のデータ 画像(動画)、テキスト、ログ ● 会社として技術力を重要視 経営層のレベルで機械学習に注力 ● 規模と自由度の高さが自分の希望に近い 大きすぎず、やりたいことができそうで、対外発表も推奨 ● 一緒に働く人がよさそう よさそうだった(直球) ● 給与、福利厚生、副業OK 総合的に見ると他よりも良かった 10 / 18

Slide 11

Slide 11 text

クックパッドでの業務 ● どんな感じで働いているか? フルフレックス( 8 hours / day ) で自由に働く 半期毎の目標を上長と摺合せて後は自分で頑張っていく {geekbot, issue, 定例MTG, 定例勉強会, 雑談}辺りで周りと情報共有 サービス化に向けて他部署と協働 ● 分析環境は? ほぼ AWS のサービスを使っている 特に EC2 は slack で管理できる ( http://techlife.cookpad.com/entry/2017/10/26/174345 ) レポジトリに Dockerfile を含めて nvidia-docker を使って環境構築 データハンドリングも codenize しよう ( https://github.com/ayemos/akagi ) 11 / 18 研究開発部でよく使うもの 用途 EC2 GPU使った機械学習(主にP2) S3 画像データや学習済みモデル Redshift ログデータとか諸々 ECS ( https://github.com/eagletmt/hako ) サービスデプロイ時に使用

Slide 12

Slide 12 text

研究開発の人員 12 / 18 今日発表してる人 R/Dは得意分野の意味で 職務的には違いはない

Slide 13

Slide 13 text

クックパッドの画像分析 ● 料理きろく 携帯端末中の画像から料理画像を抽出 画像の料理/非料理判別 登録写真数が1,000万枚を突破 https://info.cookpad.com/pr/news/press_2017_0928 ● 技術的側面 CNNを用いた分類器の構築 確認不可能なテストデータに対応 詳しくは以下の記事を参照 http://techlife.cookpad.com/entry/2017/09/14/161756 13 / 18

Slide 14

Slide 14 text

クックパッドの画像分析 ● カテゴリ分類 料理写真がどのレシピかを分類 android版がリリース (20171026時点) 色々なサービスに使っていきたい ● 技術的側面 open set problem で非常に難しい 普通の分類では誤認識が頻発 分類器の組み合わせ等で精度確保 14 / 18

Slide 15

Slide 15 text

クックパッドの画像分析 ● その他の取り組んでいること ○ 物体検出 ○ 魅力度推定 ○ 超解像 ○ 画像生成 ○ 材料分類 ○ 手順画像の抽出 ○ 代表色の抽出 ○ ... ● 画像以外も色々やってます 自然言語処理、音声インターフェース、食文化、... 15 / 18

Slide 16

Slide 16 text

イベントやります 16 / 18

Slide 17

Slide 17 text

イベントやります 17 / 18 https://cookpad.connpass.com/event/70076/

Slide 18

Slide 18 text

We’re hiring!! https://info.cookpad.com/careers/jobs/careers/division/rd-department 18 / 18