Upgrade to Pro — share decks privately, control downloads, hide ads and more …

機械学習で異常や障害予兆を検出

Koji Ishida
December 13, 2016

 機械学習で異常や障害予兆を検出

Koji Ishida

December 13, 2016
Tweet

More Decks by Koji Ishida

Other Decks in Technology

Transcript

  1. 自己紹介 • 石田浩司(@kojiisd) ‒ Acroquest Technology Co., Ltd. ‒ IoTプラットフォーム開発エンジニア

    ‒ 2012/10~2015/10 ミャンマー支社赴任 ‒ JavaOne 2015 スピーカー ‒ JAWS-UG 横浜支部 ‒ AWS re:Invent 2016 自費組(初参加) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 9 12/19 Kubernetes Advent Calendar書きます 最近お気に入りのAWSサービス:CloudFormation
  2. よく聞くIoT導入実績(感覚ベース) Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    12 データ収集 可視化 サービス化 異常検知 将来予測 0 1 2 3 IoT導入なし 多くの企業の導入状況 導入の壁? PoC(Ploof of Concept) 本番・長期運用 導入 難易度 レベル 高 低 本日登場する 「顧客」の状況
  3. TBM CBM 人による検査 1)人口減少→数的な問題・限界 2)コストがかさむ 3)見逃し なぜ異常検知が必要か? Copyright © Acroquest

    Technology Co., Ltd. All rights reserved. 13 設備保全 TBM:Time Based Maintenance CBM:Condition Based Maintenance 実際 IoT(システム)を使ってこれらの問題を解決したい まずはPoCからスタート IoTにおける異常検知の手法 例
  4. IoT+異常検知の手法 1. 閾値判定 ① 既存でもよく利用される手法。簡単だが、「閾値に達しないがおか しい場合」の検知ができない ② 閾値で検知→検知した時には異常が「発生」してしまっている ③ 既存の手法のみで上記を解決しようとすると作り込みが必要

    Copyright © Acroquest Technology Co., Ltd. All rights reserved. 14 PoCでは期間に制限が有り、達成困難 2. 機械学習 ① 時系列データからデータのパターンを学習 ② 異常なパターンを検知するようにする But… 顧客が持つイメージと実際の乖離
  5. 機械学習による異常検知は最終的に達成したい「ゴール」 Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    15 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ ギャップ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用
  6. 仮説→検証を繰り返したい Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    17 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用 いきなりの適用は避けたい そんなに 期間 取れないよ?
  7. 仮説→検証を繰り返したい Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    19 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用 いきなりの適用は不可 期間的に不可 「PoCで開始」をよく 言われてしまう現場で どのように進めたら良いか?
  8. 一旦初心に返る 1. 達成したいゴールは何か? ① 発生している異常の「検知」、「予兆」 ② 「機械学習による異常検知」はあくまで手法 2. どのようなアプローチで解決できるか? ①

    データの確保 – モノによっては異常データが存在しない。日本製のモノは丈夫。壊れないの で異常データが取れない。インフラならなおさら。 ② 傾向分析 ③ 傾向に合わせた異常検知手法の検討 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 20 顧客も巻き込んで 一緒に解決する
  9. Case:製造工場ラインの突然停止を防げ(事件編) 1. 顧客からの要望 ① とある製造工場のラインが突然停止する日々 ② 原因不明。一部のラインの停止で全体に影響 ③ 異常状態の予兆検知をしたい 2.

    プロジェクト開始時の状況 ① 取得しているデータ – 正常(と思われる期間の)データ半日分 – 突然停止が発生した前後数時間分 ② センサは「とりあえず」4ヶ所つけた。計測に適した場所かどうかは 顧客もわからない ③ PoCで開始。期間はとりあえず「1ヶ月」 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 21
  10. Case:製造工場ラインの突然停止を防げ(解決編) 1. データの傾向分析 ① 異常状態と正常状態で傾向に差があり – 単位時間あたりのスパイクの数 – スパイク発生時のセンサが示した絶対値 2.

    異常状態検知の手法の検討 ① 外れ値検知と複合イベント処理(CEP)で処理可能 3. これらをリアルタイムにデータを取得している処理に適用 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 22 ここまで顧客がイメージしていた 『機械学習』はなし
  11. 実際の流れ Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    23 1. データ受領後から顧客へのフィードバック速度に注力 ① PoC期間ではフィードバックの繰り返しと手法検討まで、と顧客とも合意した ② フィードバックのループは1週間単位で実施。フィードバック後の動きにも時間 的余裕ができる 2. 何度も「仮説〜フィードバック」を繰り返すことで、顧客も自分たちも問 題に対する理解が深まる。 エンジニアが持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 何度も繰り返す 何度も繰り返す 機械学習適用
  12. Torrentioを用いたリーンスタートアップ Copyright © Acroquest Technology Co., Ltd. All rights reserved.

    26 アイデア 構築 製品 計測 データ 学習 ビジュアルエディタによる高速な構築 →計測・学習で顧客を待たせない。 取得したデータを即可視化 計測時間を短縮 →即フィードバック、学習が可能。
  13. まとめ 1. 顧客とエンジニアが持っている異常検知プロセスの意識合 わせが必要 ① プロジェクト開始時に齟齬を埋める 2. 最小限のリソースで高速にフィードバックループを回し、本当 に現場に必要なソリューションを見出す ①

    フィードバックループを得られる「最小限のリソース」が鍵 3. 顧客とエンジニアが一体となってビジネスを成長させる意識 が重要 ① 一緒にビジネスを進める姿勢に顧客も最初から巻き込む Copyright © Acroquest Technology Co., Ltd. All rights reserved. 28
  14. Copyright © Acroquest Technology Co., Ltd. All rights reserved. 29

    ご清聴ありがとうございました。 Infrastructures Evolution