Upgrade to Pro — share decks privately, control downloads, hide ads and more …

深層学習を実運用システムに組み込むということ / To incorporate deep le...

深層学習を実運用システムに組み込むということ / To incorporate deep learning into actual operation system

Data Driven Developer Meetup #5 (2019.3.7) の発表資料です
スライド中のリンクを参照したい場合はPDFをダウンロードすると便利です。

吉田勇太 / ysdyt

March 07, 2019
Tweet

More Decks by 吉田勇太 / ysdyt

Other Decks in Technology

Transcript

  1. 自己紹介 - 吉田勇太/ysdyt(@yutatatatata) - 株式会社ブレインパッド - リードデータサイエンティスト - 学生時: バイオインフォマティクス

    - 業務: 画像分析・機械学習システムの導入 - 個人: 病理画像分類システム・某webサービスの自 然言語処理分析 - 白金鉱業 Meetup, Data Analyst Meetup Tokyo - WEEKLY人工無脳, MSゴシック絶対許さんマン
  2. - DSがたくさんいる会社です - 受託分析の老舗 - データがあるあらゆる業界 - 1案件3ヶ月~ - 1案件につきPM1名,

    メンバー1~2 名, 営業1名, 技術アドバイザー1名 が一般的なチーム構成 - 2015年後半くらいから深層学習 (AI) のビジネス活用が出始める https://ai.brainpad.co.jp/people/list/
  3. 受託分析は難しいけど、やりがいのあるお仕事 (続くツイートをまとめると) - 機械学習システムはPoCが必要 - PoC費用はR&D費から出ることが多く、一 般的にR&D費は少額でかつ真っ先に削ら れる予算 - 継続的開発が難しい

    - 各社の課題, データ, 仕様が違うので技術 的にもアセットになりにくい - SaaSにもしにくい - SaaSパッケージにしたり技術特化しない と, 分析・AIの技術はレッドオーシャンにな る一方 そんな中、2019/3/18でブレインパッド社は創業15周年
  4. - 社員による対外向け趣味活動チーム - 「技術の無駄使い」作例 - MSゴシック絶対許さんマン - 機械学習で50フォントの中からMSゴシックを見つけて床に捨て るロボット(※MSゴシック大好き!) -

    麻雀牌のリアルタイム検出 - 画像解析によるリアルタイムでの麻雀点数の自動計算を目指し て。Google DevFest Tokyo2018でも登壇。 - オフトゥンフライングシステム - ダジャレの面白さを機械学習で判定。一定スコア以上で布団が 吹っ飛ぶ!ホリエモン万博にも招待され展示。
  5. (宣伝)白金鉱業 Meetup - ブレインパッド有志メンバーで運営しているDS, MLエンジニア向けの交流会兼勉強 会イベント - だいたい各月開催 - 弊社DS、DS部門の部長・副部長、営業部も発表

    - 社外スピーカー(業界不問・同業welcome) - ABEJA齋藤さん, マスクド・アナライズ氏, メルペイ藤原さん, Classi伊藤さん, u++さん - 弊社卒業生の人に喋ってもらったり - GROOVE X アレさん, PFN菅原さん - 次回Vol.7は4月末予定!
  6. 本日の内容 ▪ 話さないこと - 実際のプロジェクト内容 - 深層学習アルゴリズムの詳細 - 機械学習システム導入はなぜ失敗するか← ▪

    話すこと - 異常検知システム構築にまつわる概要 - 「不良品検知精度さえ高ければ良い」の罠 - 半機械・半人力なシステムを目指して - 機械学習システムを”高利子クレジットカード”にしないために - MLOpsの前にやるべきこと をフォローしましょう
  7. 製造現場の異常検知 - キューピー - 不良品ポテトの除去 - PFN - PFN Visual

    Inspection 図引用: https://www.businessinsider.jp/post-108027
  8. 良品の誤検知問題 - 良品の誤検知自体がコストになる場合もある - 単価の高い商品の場合 - 不良品を再度原料に戻して再利用する場合(ex. 不良ネジを溶かして再度成形) - 不良品を精度良く検知できても、良品誤検知が増えてコストが減らせないなら導入する意味

    がない! - Recallを上げる代償にPrecisionを下げる、ということは実は出来ないという現実のジレン マ - PrecisionもRecallも8割あるのに!不良品検知精度十分高いのに!オペレーションに乗せ られない!、ということが起こる。ではどうする?
  9. - 人の介在を前提とした機械学習の仕組みづくり - ex. 難しいところだけ人間が判断 - 全量目検と比較すると大幅コストダウン - ex. 機械が判断したものを人間が抜き打ちチェック(ダブルチェック)

    - 機械学習の精度の「ラストワンマイル」を埋めようとすると大きなコストがかかるが、人 間なら比較的簡単に行える - Human-in-the-loopで精度改善していく - オペレーションを工夫して割り切りも大切(目的を明確に!) 機械学習システムと人の役割分担
  10. オペレーションも環境も変化が必要 どれを選択するかで現場オペレーションも変わる - 誤検知を許容する - 誤検知・見逃しを多少許す - 人間に一部判断を任せる オペレーションが変わると現場環境(ハードウェア)も変わる可能性高 -

    撮影システムの変更 - ベルトコンベアシステムの変更 - 不良品を除去する装置の変更 など ←誤検知はどう扱う? ←不良品をその後どう取り除く? ←システムが判断した部分は盲目的に信じる? 機械学習システム導入は、人的なコスト(AIのお守り)も設備投資も必要 ⇒ システム導入インパクトの試算はもちろん大切
  11. 機械学習システムを高利子クレカにしないために - 保守・運用 - Human-in-the-loopで人を設置する - 人的コストを完全にゼロにはできない - システム担当者にはそこそこリテラシーが必要(結果の見方、何をして いうのか理解、うまく動かない場合の原因イメージ)

    - 現場の人でも扱える再学習(他製品展開)機能が必要 - DSが張り付くわけではない - 現場人がパラメータチューニング的なことをしないといけない - 定量評価結果を理解するためのリテラシーが必要(Precision/Recall) - ちょっとしたトラブルには現場だけで対応できないといけない - 社内に機械学習担当者が必要orリテラシーを現場で高める
  12. - 技術面 - アルゴリズムの汎化性能 - 新商品にも全部1商品1model作るのはちょっと… - 良品が「完全な定形」ではない物体に対する検知の難しさ - ex.

    完全な定形: ネジとか - しかし意外にそういった製品は多い - アノテーションの質を一定にし続ける難しさ 機械学習システムを高利子クレカにしないために
  13. まとめ - 製造現場の機械学習異常検知システムの話をしました - 深層学習(AI)が全自動でよしなにやってくれるわけではない - 不良品検知精度が高いだけで課題解決というわけではない - 良品の誤検知問題 など

    - 人間も関与するHuman-in-the-loopなシステムが健康的 - 検知方法・オペレーション・ハードウェアを目的に則して変化させる - MLOps的なことも考えないといけないが、その前に業務フロー整理や課題の 洗い出し、システム設計などの当たり前をきちんとやるのが大切
  14. (追記)会場からの質問 - Q: プロジェクトのどの段階で業務フローの洗い出しや課題検討を行う? - A: 理想はプロジェクトの一番最初。 - しかし現実は「AIプロジェクトをやるぞ!」というクライアントに「では業務フローの洗い出しか ら…」とお願いするとプロジェクト全体の士気が下がることも。

    - なので、PoCで良い結果を出したり、試作機など動くものを作ってチームの熱量が高まったと ころでお願いをするというのも一つのやり方。 (※何かと連携することが決まっているor工場ラインのように後から修正が難しいものものはそれでも早めに要件定 義が必要) - AIプロジェクトでは長い期間に渡って泥臭い作業が沢山発生するので、チーム全体のモチ ベーションを高く保てるかどうかも重要なポイント(だってにんげんだもの)