ぼくのかんがえたさいきょうの機械学習プロジェクト進行法（PoC/デモ編）

ぼくのかんがえたさいきょうの機械学習プロダクト進⾏行行法（PoC/デモ開発編） by Norihiro Shimoda

⾃自⼰己紹介 • 下⽥田倫倫⼤大(@rindai87) • データ分析専業の企業のエンジニアマネージャー • TensorFlow User Group(TFUG)主催者 •
GDE(Google Developer Expert)のML Expert

今⽇日お話すること機械学習要素が⼊入ったプロダクト開発のベストプラクティスっぽい何かただし、PoCやデモフェーズまでそこから先は⾊色々とアレなので含んでいません

注意結果うまく⾔言った話を後から整理理したのでキレイに⾒見見えますが実際はすごく泥泥臭いです

想定オーディエンスお客様（つよい）わたしたち（よわい）⼀一ヶ⽉月後までにイベント⽤用の機械学習のデモ作りたいんだけどは、はひぃぃぃ⼆二ヶ⽉月後までにPoC終わら
して成果をエライ⼈人の前でデモしたいんだけど

っていう状況でプロジェクトマネジメントしないといけなくなった⼈人たちに捧げる話

（機械学習）エンジニアデータサイエンティストプロジェクト推進役 PM / PO的な⼈人最近の問題意識識案外⼈人材はいる圧倒的不不⾜足

プロジェクト推進役 • データサイエンティストと機械学習っぽい話をする • エンジニアとシステムや開発っぽい話をする • クライアントと要件やビジネスっぽい話をする • 全部まとめてやるべきこと/やらないことを決めるこういう⼈人がいないと
カジュアルに炎上します

1ヶ⽉月くらい 5⼈人くらい（公開できる）私の経験その1

Serving Mode

Learning Mode

https://sho-‐‑‒soar.github.io/slides/tfug5/#/ https://goo.gl/Vi7hTE 技術的な細かい話は以下からどうぞ

1.5ヶ⽉月くらい 5⼈人くらい（公開できる）私の経験その2

期間の割にボリュームあるな− って思いました？通常の案件でもだいたい似たようなものだったりしますだいたい3〜～5⼈人で1〜～2ヶ⽉月くらい

PoC/デモ開発プロジェクトの進⾏行行 1. 要望のヒアリング / 要件の整理理 2. 全体のラフ案の整理理 3. ラフ案の実現可能性の検証 4.
ラフ案から設計の起こし 5. 実装！実装！ 6. テスト！テスト！ 7. 制約条件やオペレーションの整理理 8. 納品（デモならセットアップやサポートなども）この辺まで精度度の良良い⾒見見積もりができないが時間がないので、エイヤでやらざるを得ない

顧客要望の機械学習的観点での整理理テーブルの上にあるお菓⼦子を認識識して、ロボットで掴むと⾯面⽩白いと思うんですよね。⾳音声で⼊入⼒力力してお薦めをレコメンドする感じです。レコメンドロジックの構築から逆算し、ロボットの操作に⽬目処をつけなければいけない案件⾳音声認識識と物体認識識（画像処理理）は確実に出て来るな。お勧めのレコメンドをどうするかがポイントの案件だな。あとロボットの所もどうするかだな。

こんな案件っぽいな、と分かるわけです⾳音声認識識画像処理理レコメンドロジックロボットの操作

レコメンドロジックを決めるとこうなります⾳音声認識識による⽂文字起こしお菓⼦子画像の切切り出し Word2vec による特徴量量化⽬目標物認識識
発話テーブルの上のお菓⼦子 CNNによる画像の特徴量量化ベクトルの内積レコメンドロジック⽬目標物取得ロボットの操作

実現可能性の検証に⼊入ります • ⾳音声認識識での⽂文字起こし • お菓⼦子画像の画像切切り出し • word2vecをどう実現するか • CNNをどう実現するか •
ロボットの操作はそもそもどうするのか？ – ロボット⾃自体の選定 – 選定したロボットの精度度などの動作まわりパーツパーツが全体のシナリオにあった形でうごくのか？という観点での選定/検証

実現可能性検証〜～実装のポイント • 基本的に⾃自前でモデルやアルゴリズムを作らない • モデルやアルゴリズムは差し替えしやすくしておく • 実装は基本エイヤーで頑張るしかない – たぶんプログラミング⾔言語選定はPython⼀一択

⾃自前で作らず検証⾳音声認識識 Cloud Speech API Web Speech API ⽂文字起こしの形態素解析 Cloud
NL API ⽂文字起こしの特徴量量化 Gensim + word2vec-‐‑‒ Googlenews-‐‑‒vectors 画像の切切り出し OpenCV 画像の特徴量量化 TensorFlow + Inception V3 今回はGoogle Cloudのイベントだったのでこんな感じですが、もちろんGoogle製品じゃなくてもできることはありますねここの選び⽅方を失敗すると死にます

センスの良良いあなたによって実現可能性が確認できました！モデルの精度度やら⾊色々気になりますが、動きそうならこの時点ではOKとします ※この時点でOKしたやつがだいたい最終化されます

モデルの差し替え • 最初は公開されているモデルやライブラリでとにかく試してみる • 全部作り終わってから精度度向上を検討する時にモデル⾃自体は再考する – word2vecの辞書を別のものに変える –
CNNのモデルをInception-‐‑‒v3から別のものに変える – あるいは⾃自前で作る

実装 • まあ基本は気合でエイヤーの世界となります • 機械学習系のライブラリはPythonが充実しているので、必然的にPythonで作ると効率率率が良良くなります • なので、Flaskあたりで薄いAPIを作って裏裏側でほげほげ、みたいな感じになるかと Web
API By Flask ML App

テスト〜～制約条件の洗い出し • 実装ができたらひたすらテスト • テストの⽬目的はバグの洗い出しだけではなく、実装されたものの制約条件を洗い出す • 制約条件はお客様にお伝えしてご理理解/ご納得いただく – 制約条件がそのままデモシナリオに反映されていくイメージ

ということで、、、 • ここまできちんと進めると「特定条件下」で「要望を満たすように」動いている何かができてきます • そこから可能な範囲で精度度の向上など頑張りましょう

その他どうでも良良いTips

その他どうでも良良いTips • ベンダーが複数出てくる時、インターフェースの責務をこっちに寄せる – 調整するコストの⽅方が⾼高いので、よっぽどの事がない限り相⼿手が欲しがるプロトコルで欲しいデータを作って上げる • 転ばぬ先の杖は多めに⽤用意する –
特にデモの場合（かつハードウェアが絡む場合）⽤用意周到過ぎる準備をしたとしても、それでも不不⾜足の⾃自体が起こる

「何とかなる」という強い⼼心を持つことが⼀一番⼤大事でしょうほぼ毎⽇日「できそう」と「できないかも」を往復復する不不安定な⽇日々が続きます

まとめ • 機械学習は⽇日々進化しており、それを使ったプロジェクトは⽇日々難易易度度が増し、特にプロジェクト推進役には職⼈人化/属⼈人化が加速しています。 • 知⾒見見を共有し合う場が欲しいと思う今⽇日このごろです。

おまけ（TFUG告知） • 発表者はいつでも募集中！ – TFがちょっとでもかすってたらOKです！ • 運営側の参加者募集中！
– めっちゃ肥⼤大化してますが今のところ2⼈人体制なので⾟辛いです！ – 今ならやりたい放題やっていただけます！

Thanks!!

ぼくのかんがえたさいきょうの機械学習プロジェクト進行法（PoC/デモ編）

ぼくのかんがえたさいきょうの機械学習プロジェクト進行法（PoC/デモ編）

Norihiro Shimoda

More Decks by Norihiro Shimoda

Other Decks in Technology

Featured

Transcript

ぼくのかんがえたさいきょうの機械学習プロダクト進⾏行行法（PoC/デモ開発編） by Norihiro Shimoda

⾃自⼰己紹介 • 下⽥田倫倫⼤大(@rindai87) • データ分析専業の企業のエンジニアマネージャー • TensorFlow User Group(TFUG)主催者 •

今⽇日お話すること機械学習要素が⼊入ったプロダクト開発のベストプラクティスっぽい何かただし、PoCやデモフェーズまでそこから先は⾊色々とアレなので含んでいません

注意結果うまく⾔言った話を後から整理理したのでキレイに⾒見見えますが実際はすごく泥泥臭いです

想定オーディエンスお客様（つよい）わたしたち（よわい）⼀一ヶ⽉月後までにイベント⽤用の機械学習のデモ作りたいんだけどは、はひぃぃぃ⼆二ヶ⽉月後までにPoC終わら

っていう状況でプロジェクトマネジメントしないといけなくなった⼈人たちに捧げる話

（機械学習）エンジニアデータサイエンティストプロジェクト推進役 PM / PO的な⼈人最近の問題意識識案外⼈人材はいる圧倒的不不⾜足

1ヶ⽉月くらい 5⼈人くらい（公開できる）私の経験その1

Serving Mode

Learning Mode

https://sho-‐‑‒soar.github.io/slides/tfug5/#/ https://goo.gl/Vi7hTE 技術的な細かい話は以下からどうぞ

1.5ヶ⽉月くらい 5⼈人くらい（公開できる）私の経験その2

期間の割にボリュームあるな− って思いました？通常の案件でもだいたい似たようなものだったりしますだいたい3〜～5⼈人で1〜～2ヶ⽉月くらい

PoC/デモ開発プロジェクトの進⾏行行 1. 要望のヒアリング / 要件の整理理 2. 全体のラフ案の整理理 3. ラフ案の実現可能性の検証 4.

こんな案件っぽいな、と分かるわけです⾳音声認識識画像処理理レコメンドロジックロボットの操作

レコメンドロジックを決めるとこうなります⾳音声認識識による⽂文字起こしお菓⼦子画像の切切り出し Word2vec による特徴量量化⽬目標物認識識

実現可能性の検証に⼊入ります • ⾳音声認識識での⽂文字起こし • お菓⼦子画像の画像切切り出し • word2vecをどう実現するか • CNNをどう実現するか •

⾃自前で作らず検証⾳音声認識識 Cloud Speech API Web Speech API ⽂文字起こしの形態素解析 Cloud

センスの良良いあなたによって実現可能性が確認できました！モデルの精度度やら⾊色々気になりますが、動きそうならこの時点ではOKとします ※この時点でOKしたやつがだいたい最終化されます

モデルの差し替え • 最初は公開されているモデルやライブラリでとにかく試してみる • 全部作り終わってから精度度向上を検討する時にモデル⾃自体は再考する – word2vecの辞書を別のものに変える –

ということで、、、 • ここまできちんと進めると「特定条件下」で「要望を満たすように」動いている何かができてきます • そこから可能な範囲で精度度の向上など頑張りましょう

その他どうでも良良いTips

「何とかなる」という強い⼼心を持つことが⼀一番⼤大事でしょうほぼ毎⽇日「できそう」と「できないかも」を往復復する不不安定な⽇日々が続きます

おまけ（TFUG告知） • 発表者はいつでも募集中！ – TFがちょっとでもかすってたらOKです！ • 運営側の参加者募集中！

Thanks!!