Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
機械学習で異常や障害予兆を検出
Koji Ishida
December 13, 2016
Technology
1
1.1k
機械学習で異常や障害予兆を検出
Koji Ishida
December 13, 2016
Tweet
Share
More Decks by Koji Ishida
See All by Koji Ishida
サーバレスでDynamoDBレスなIoTアプリ開発
kojiisd
0
390
AWSAmplifyHappyDev.pdf
kojiisd
1
2k
ぼんやりとしてたサーバレスアプリの監視を本格的に行おうとした話
kojiisd
0
580
はじめてのCloudFormation
kojiisd
0
1.6k
Other Decks in Technology
See All in Technology
目指せCoverage100%! AutoScale環境におけるSavings Plans購入戦略 / JAWS-UG_SRE_Coverage
taishin
0
530
スクラムマスターの悩みどころを赤裸々に告白します
nagata03
0
200
Oracle Cloud Infrastructure:2023年1月度サービス・アップデート
oracle4engineer
PRO
0
190
PCI DSS に準拠したシステム開発
yutadayo
0
320
03_ユーザビリティテスト
kouzoukaikaku
0
820
re:Invent2022 前後の Amazon EventBridge のアップデートを踏まえつつ、情シスの仕事をより楽しくしたい話。 / EventBridge for Information Systems Department
_kensh
2
800
Exploring MapStore Release 2022.02: improved 3DTiles support and more
simboss
PRO
0
410
re:Invent発表のサービスを取り入れて加速する弥生のSecurity&Governance / accelerating YAYOI's Security and Governance with services announced at reinvent
yayoi_dd
0
160
AWS re:Invent 2022で発表された新機能を試してみた ~Cloud OperationとSecurity~ / New Cloud Operation and Security Features Announced at AWS reInvent 2022
yuj1osm
1
230
FlexScan HD2452Wの 後継を探して
tring
0
6.6k
UEでPLATEAU触ってみた
41h0_shiho
0
250
Deep dive in Reserved Instance ~脳死推奨量購入からの脱却~
kzkmaeda
0
560
Featured
See All Featured
For a Future-Friendly Web
brad_frost
166
7.8k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
2
410
Unsuck your backbone
ammeep
659
56k
Art, The Web, and Tiny UX
lynnandtonic
284
18k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
22
1.7k
Music & Morning Musume
bryan
37
4.7k
Web development in the modern age
philhawksworth
197
9.6k
Ruby is Unlike a Banana
tanoku
93
9.6k
Teambox: Starting and Learning
jrom
124
7.9k
GraphQLとの向き合い方2022年版
quramy
20
9.9k
Agile that works and the tools we love
rasmusluckow
321
20k
The Web Native Designer (August 2011)
paulrobertlloyd
76
2.2k
Transcript
機械学習で異常や障害予兆を検出 2016/12/12 Acroquest Technology Co., Ltd. 石田浩司
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 2
IoTエンジニアの人?
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 3
展示会などでよく聞く話
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 4
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 5
異常検知 高精度
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 6
現場のエンジニアが語る 機械学習による異常検知の実際 2016/12/12 Acroquest Technology Co., Ltd. 石田浩司
今日お話ししない内容 1. 機械学習の技術的な内容 ① 教師あり/教師なし機械学習の詳細 ② Deep Learning – 僕があんまりわかってないから
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 8 あくまで現場の声をお届けします。
自己紹介 • 石田浩司(@kojiisd) ‒ Acroquest Technology Co., Ltd. ‒ IoTプラットフォーム開発エンジニア
‒ 2012/10~2015/10 ミャンマー支社赴任 ‒ JavaOne 2015 スピーカー ‒ JAWS-UG 横浜支部 ‒ AWS re:Invent 2016 自費組(初参加) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 9 12/19 Kubernetes Advent Calendar書きます 最近お気に入りのAWSサービス:CloudFormation
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 10
AWS Summit Tokyo
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 11
Embedded Technology展
よく聞くIoT導入実績(感覚ベース) Copyright © Acroquest Technology Co., Ltd. All rights reserved.
12 データ収集 可視化 サービス化 異常検知 将来予測 0 1 2 3 IoT導入なし 多くの企業の導入状況 導入の壁? PoC(Ploof of Concept) 本番・長期運用 導入 難易度 レベル 高 低 本日登場する 「顧客」の状況
TBM CBM 人による検査 1)人口減少→数的な問題・限界 2)コストがかさむ 3)見逃し なぜ異常検知が必要か? Copyright © Acroquest
Technology Co., Ltd. All rights reserved. 13 設備保全 TBM:Time Based Maintenance CBM:Condition Based Maintenance 実際 IoT(システム)を使ってこれらの問題を解決したい まずはPoCからスタート IoTにおける異常検知の手法 例
IoT+異常検知の手法 1. 閾値判定 ① 既存でもよく利用される手法。簡単だが、「閾値に達しないがおか しい場合」の検知ができない ② 閾値で検知→検知した時には異常が「発生」してしまっている ③ 既存の手法のみで上記を解決しようとすると作り込みが必要
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 14 PoCでは期間に制限が有り、達成困難 2. 機械学習 ① 時系列データからデータのパターンを学習 ② 異常なパターンを検知するようにする But… 顧客が持つイメージと実際の乖離
機械学習による異常検知は最終的に達成したい「ゴール」 Copyright © Acroquest Technology Co., Ltd. All rights reserved.
15 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ ギャップ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用
現場の声:まず何が必要か、検討したい 1. 実際に測定してみないとわからないことが多い ① 機械学習も解決「手法」の一つ。何が必要かをまずは整理したい。 – 教師有の機械学習であればなおさら、正解の定義やモデルの定義など、時 間をかけて検討する必要がある。 2. 仮説→検証の繰り返しで適用の仕方を検討
① ある程度の期間が必要 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 16 いきなり機械学習・異常検知ではなく まず準備・検討したい
仮説→検証を繰り返したい Copyright © Acroquest Technology Co., Ltd. All rights reserved.
17 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用 いきなりの適用は避けたい そんなに 期間 取れないよ?
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 18
仮説→検証を繰り返したい Copyright © Acroquest Technology Co., Ltd. All rights reserved.
19 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用 いきなりの適用は不可 期間的に不可 「PoCで開始」をよく 言われてしまう現場で どのように進めたら良いか?
一旦初心に返る 1. 達成したいゴールは何か? ① 発生している異常の「検知」、「予兆」 ② 「機械学習による異常検知」はあくまで手法 2. どのようなアプローチで解決できるか? ①
データの確保 – モノによっては異常データが存在しない。日本製のモノは丈夫。壊れないの で異常データが取れない。インフラならなおさら。 ② 傾向分析 ③ 傾向に合わせた異常検知手法の検討 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 20 顧客も巻き込んで 一緒に解決する
Case:製造工場ラインの突然停止を防げ(事件編) 1. 顧客からの要望 ① とある製造工場のラインが突然停止する日々 ② 原因不明。一部のラインの停止で全体に影響 ③ 異常状態の予兆検知をしたい 2.
プロジェクト開始時の状況 ① 取得しているデータ – 正常(と思われる期間の)データ半日分 – 突然停止が発生した前後数時間分 ② センサは「とりあえず」4ヶ所つけた。計測に適した場所かどうかは 顧客もわからない ③ PoCで開始。期間はとりあえず「1ヶ月」 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 21
Case:製造工場ラインの突然停止を防げ(解決編) 1. データの傾向分析 ① 異常状態と正常状態で傾向に差があり – 単位時間あたりのスパイクの数 – スパイク発生時のセンサが示した絶対値 2.
異常状態検知の手法の検討 ① 外れ値検知と複合イベント処理(CEP)で処理可能 3. これらをリアルタイムにデータを取得している処理に適用 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 22 ここまで顧客がイメージしていた 『機械学習』はなし
実際の流れ Copyright © Acroquest Technology Co., Ltd. All rights reserved.
23 1. データ受領後から顧客へのフィードバック速度に注力 ① PoC期間ではフィードバックの繰り返しと手法検討まで、と顧客とも合意した ② フィードバックのループは1週間単位で実施。フィードバック後の動きにも時間 的余裕ができる 2. 何度も「仮説〜フィードバック」を繰り返すことで、顧客も自分たちも問 題に対する理解が深まる。 エンジニアが持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 何度も繰り返す 何度も繰り返す 機械学習適用
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 24
リーンスタートアップ
フィードバックループが生きる世界 1. リーンスタートアップの「フィードバックループ」が今回のよう な顧客の課題解決に合っている、と実感 2. 顧客もエンジニアも、フィードバックループを通して学習する ことが必要 Copyright © Acroquest
Technology Co., Ltd. All rights reserved. 25 顧客と一体となってビジネスを成長させる
Torrentioを用いたリーンスタートアップ Copyright © Acroquest Technology Co., Ltd. All rights reserved.
26 アイデア 構築 製品 計測 データ 学習 ビジュアルエディタによる高速な構築 →計測・学習で顧客を待たせない。 取得したデータを即可視化 計測時間を短縮 →即フィードバック、学習が可能。
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 27
DEMO
まとめ 1. 顧客とエンジニアが持っている異常検知プロセスの意識合 わせが必要 ① プロジェクト開始時に齟齬を埋める 2. 最小限のリソースで高速にフィードバックループを回し、本当 に現場に必要なソリューションを見出す ①
フィードバックループを得られる「最小限のリソース」が鍵 3. 顧客とエンジニアが一体となってビジネスを成長させる意識 が重要 ① 一緒にビジネスを進める姿勢に顧客も最初から巻き込む Copyright © Acroquest Technology Co., Ltd. All rights reserved. 28
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 29
ご清聴ありがとうございました。 Infrastructures Evolution