Upgrade to Pro — share decks privately, control downloads, hide ads and more …

機械学習で異常や障害予兆を検出

7082ac9c4be7588ac197ba17d0972242?s=47 Koji Ishida
December 13, 2016

 機械学習で異常や障害予兆を検出

7082ac9c4be7588ac197ba17d0972242?s=128

Koji Ishida

December 13, 2016
Tweet

Transcript

  1. 機械学習で異常や障害予兆を検出 2016/12/12 Acroquest Technology Co., Ltd. 石田浩司

  2. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 2

    IoTエンジニアの人?
  3. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 3

    展示会などでよく聞く話
  4. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 4

  5. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 5

    異常検知 高精度
  6. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 6

  7. 現場のエンジニアが語る 機械学習による異常検知の実際 2016/12/12 Acroquest Technology Co., Ltd. 石田浩司

  8. 今日お話ししない内容 1. 機械学習の技術的な内容 ① 教師あり/教師なし機械学習の詳細 ② Deep Learning – 僕があんまりわかってないから

    Copyright © Acroquest Technology Co., Ltd. All rights reserved. 8 あくまで現場の声をお届けします。
  9. 自己紹介 • 石田浩司(@kojiisd) ‒ Acroquest Technology Co., Ltd. ‒ IoTプラットフォーム開発エンジニア

    ‒ 2012/10~2015/10 ミャンマー支社赴任 ‒ JavaOne 2015 スピーカー ‒ JAWS-UG 横浜支部 ‒ AWS re:Invent 2016 自費組(初参加) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 9 12/19 Kubernetes Advent Calendar書きます 最近お気に入りのAWSサービス:CloudFormation
  10. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 10

    AWS Summit Tokyo
  11. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 11

    Embedded Technology展
  12. よく聞くIoT導入実績(感覚ベース) Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    12 データ収集 可視化 サービス化 異常検知 将来予測 0 1 2 3 IoT導入なし 多くの企業の導入状況 導入の壁? PoC(Ploof of Concept) 本番・長期運用 導入 難易度 レベル 高 低 本日登場する 「顧客」の状況
  13. TBM CBM 人による検査 1)人口減少→数的な問題・限界 2)コストがかさむ 3)見逃し なぜ異常検知が必要か? Copyright © Acroquest

    Technology Co., Ltd. All rights reserved. 13 設備保全 TBM:Time Based Maintenance CBM:Condition Based Maintenance 実際 IoT(システム)を使ってこれらの問題を解決したい まずはPoCからスタート IoTにおける異常検知の手法 例
  14. IoT+異常検知の手法 1. 閾値判定 ① 既存でもよく利用される手法。簡単だが、「閾値に達しないがおか しい場合」の検知ができない ② 閾値で検知→検知した時には異常が「発生」してしまっている ③ 既存の手法のみで上記を解決しようとすると作り込みが必要

    Copyright © Acroquest Technology Co., Ltd. All rights reserved. 14 PoCでは期間に制限が有り、達成困難 2. 機械学習 ① 時系列データからデータのパターンを学習 ② 異常なパターンを検知するようにする But… 顧客が持つイメージと実際の乖離
  15. 機械学習による異常検知は最終的に達成したい「ゴール」 Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    15 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ ギャップ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用
  16. 現場の声:まず何が必要か、検討したい 1. 実際に測定してみないとわからないことが多い ① 機械学習も解決「手法」の一つ。何が必要かをまずは整理したい。 – 教師有の機械学習であればなおさら、正解の定義やモデルの定義など、時 間をかけて検討する必要がある。 2. 仮説→検証の繰り返しで適用の仕方を検討

    ① ある程度の期間が必要 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 16 いきなり機械学習・異常検知ではなく まず準備・検討したい
  17. 仮説→検証を繰り返したい Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    17 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用 いきなりの適用は避けたい そんなに 期間 取れないよ?
  18. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 18

  19. 仮説→検証を繰り返したい Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    19 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用 いきなりの適用は不可 期間的に不可 「PoCで開始」をよく 言われてしまう現場で どのように進めたら良いか?
  20. 一旦初心に返る 1. 達成したいゴールは何か? ① 発生している異常の「検知」、「予兆」 ② 「機械学習による異常検知」はあくまで手法 2. どのようなアプローチで解決できるか? ①

    データの確保 – モノによっては異常データが存在しない。日本製のモノは丈夫。壊れないの で異常データが取れない。インフラならなおさら。 ② 傾向分析 ③ 傾向に合わせた異常検知手法の検討 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 20 顧客も巻き込んで 一緒に解決する
  21. Case:製造工場ラインの突然停止を防げ(事件編) 1. 顧客からの要望 ① とある製造工場のラインが突然停止する日々 ② 原因不明。一部のラインの停止で全体に影響 ③ 異常状態の予兆検知をしたい 2.

    プロジェクト開始時の状況 ① 取得しているデータ – 正常(と思われる期間の)データ半日分 – 突然停止が発生した前後数時間分 ② センサは「とりあえず」4ヶ所つけた。計測に適した場所かどうかは 顧客もわからない ③ PoCで開始。期間はとりあえず「1ヶ月」 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 21
  22. Case:製造工場ラインの突然停止を防げ(解決編) 1. データの傾向分析 ① 異常状態と正常状態で傾向に差があり – 単位時間あたりのスパイクの数 – スパイク発生時のセンサが示した絶対値 2.

    異常状態検知の手法の検討 ① 外れ値検知と複合イベント処理(CEP)で処理可能 3. これらをリアルタイムにデータを取得している処理に適用 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 22 ここまで顧客がイメージしていた 『機械学習』はなし
  23. 実際の流れ Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    23 1. データ受領後から顧客へのフィードバック速度に注力 ① PoC期間ではフィードバックの繰り返しと手法検討まで、と顧客とも合意した ② フィードバックのループは1週間単位で実施。フィードバック後の動きにも時間 的余裕ができる 2. 何度も「仮説〜フィードバック」を繰り返すことで、顧客も自分たちも問 題に対する理解が深まる。 エンジニアが持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 何度も繰り返す 何度も繰り返す 機械学習適用
  24. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 24

    リーンスタートアップ
  25. フィードバックループが生きる世界 1. リーンスタートアップの「フィードバックループ」が今回のよう な顧客の課題解決に合っている、と実感 2. 顧客もエンジニアも、フィードバックループを通して学習する ことが必要 Copyright © Acroquest

    Technology Co., Ltd. All rights reserved. 25 顧客と一体となってビジネスを成長させる
  26. Torrentioを用いたリーンスタートアップ Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    26 アイデア 構築 製品 計測 データ 学習 ビジュアルエディタによる高速な構築 →計測・学習で顧客を待たせない。 取得したデータを即可視化 計測時間を短縮 →即フィードバック、学習が可能。
  27. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 27

    DEMO
  28. まとめ 1. 顧客とエンジニアが持っている異常検知プロセスの意識合 わせが必要 ① プロジェクト開始時に齟齬を埋める 2. 最小限のリソースで高速にフィードバックループを回し、本当 に現場に必要なソリューションを見出す ①

    フィードバックループを得られる「最小限のリソース」が鍵 3. 顧客とエンジニアが一体となってビジネスを成長させる意識 が重要 ① 一緒にビジネスを進める姿勢に顧客も最初から巻き込む Copyright © Acroquest Technology Co., Ltd. All rights reserved. 28
  29. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 29

    ご清聴ありがとうございました。 Infrastructures Evolution