Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習で異常や障害予兆を検出
Search
Koji Ishida
December 13, 2016
Technology
1
1.4k
機械学習で異常や障害予兆を検出
Koji Ishida
December 13, 2016
Tweet
Share
More Decks by Koji Ishida
See All by Koji Ishida
サーバレスでDynamoDBレスなIoTアプリ開発
kojiisd
0
610
AWSAmplifyHappyDev.pdf
kojiisd
1
2.4k
ぼんやりとしてたサーバレスアプリの監視を本格的に行おうとした話
kojiisd
0
780
はじめてのCloudFormation
kojiisd
0
1.9k
Other Decks in Technology
See All in Technology
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
520
SREが向き合う大規模リアーキテクチャ 〜信頼性とアジリティの両立〜
zepprix
0
480
[CV勉強会@関東 World Model 読み会] Orbis: Overcoming Challenges of Long-Horizon Prediction in Driving World Models (Mousakhan+, NeurIPS 2025)
abemii
0
150
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
580
今こそ学びたいKubernetesネットワーク ~CNIが繋ぐNWとプラットフォームの「フラッと」な対話
logica0419
5
530
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
2.1k
Kiro IDEのドキュメントを全部読んだので地味だけどちょっと嬉しい機能を紹介する
khmoryz
0
210
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
1.7k
30万人の同時アクセスに耐えたい!新サービスの盤石なリリースを支える負荷試験 / SRE Kaigi 2026
genda
4
1.4k
ECS障害を例に学ぶ、インシデント対応に備えたAIエージェントの育て方 / How to develop AI agents for incident response with ECS outage
iselegant
4
430
猫でもわかるKiro CLI(セキュリティ編)
kentapapa
0
120
Claude_CodeでSEOを最適化する_AI_Ops_Community_Vol.2__マーケティングx_AIはここまで進化した.pdf
riku_423
2
610
Featured
See All Featured
RailsConf 2023
tenderlove
30
1.3k
Crafting Experiences
bethany
1
54
Being A Developer After 40
akosma
91
590k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
Writing Fast Ruby
sferik
630
62k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
110
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
470
Designing for Timeless Needs
cassininazir
0
130
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
170
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
240
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
130
Transcript
機械学習で異常や障害予兆を検出 2016/12/12 Acroquest Technology Co., Ltd. 石田浩司
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 2
IoTエンジニアの人?
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 3
展示会などでよく聞く話
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 4
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 5
異常検知 高精度
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 6
現場のエンジニアが語る 機械学習による異常検知の実際 2016/12/12 Acroquest Technology Co., Ltd. 石田浩司
今日お話ししない内容 1. 機械学習の技術的な内容 ① 教師あり/教師なし機械学習の詳細 ② Deep Learning – 僕があんまりわかってないから
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 8 あくまで現場の声をお届けします。
自己紹介 • 石田浩司(@kojiisd) ‒ Acroquest Technology Co., Ltd. ‒ IoTプラットフォーム開発エンジニア
‒ 2012/10~2015/10 ミャンマー支社赴任 ‒ JavaOne 2015 スピーカー ‒ JAWS-UG 横浜支部 ‒ AWS re:Invent 2016 自費組(初参加) Copyright © Acroquest Technology Co., Ltd. All rights reserved. 9 12/19 Kubernetes Advent Calendar書きます 最近お気に入りのAWSサービス:CloudFormation
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 10
AWS Summit Tokyo
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 11
Embedded Technology展
よく聞くIoT導入実績(感覚ベース) Copyright © Acroquest Technology Co., Ltd. All rights reserved.
12 データ収集 可視化 サービス化 異常検知 将来予測 0 1 2 3 IoT導入なし 多くの企業の導入状況 導入の壁? PoC(Ploof of Concept) 本番・長期運用 導入 難易度 レベル 高 低 本日登場する 「顧客」の状況
TBM CBM 人による検査 1)人口減少→数的な問題・限界 2)コストがかさむ 3)見逃し なぜ異常検知が必要か? Copyright © Acroquest
Technology Co., Ltd. All rights reserved. 13 設備保全 TBM:Time Based Maintenance CBM:Condition Based Maintenance 実際 IoT(システム)を使ってこれらの問題を解決したい まずはPoCからスタート IoTにおける異常検知の手法 例
IoT+異常検知の手法 1. 閾値判定 ① 既存でもよく利用される手法。簡単だが、「閾値に達しないがおか しい場合」の検知ができない ② 閾値で検知→検知した時には異常が「発生」してしまっている ③ 既存の手法のみで上記を解決しようとすると作り込みが必要
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 14 PoCでは期間に制限が有り、達成困難 2. 機械学習 ① 時系列データからデータのパターンを学習 ② 異常なパターンを検知するようにする But… 顧客が持つイメージと実際の乖離
機械学習による異常検知は最終的に達成したい「ゴール」 Copyright © Acroquest Technology Co., Ltd. All rights reserved.
15 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ ギャップ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用
現場の声:まず何が必要か、検討したい 1. 実際に測定してみないとわからないことが多い ① 機械学習も解決「手法」の一つ。何が必要かをまずは整理したい。 – 教師有の機械学習であればなおさら、正解の定義やモデルの定義など、時 間をかけて検討する必要がある。 2. 仮説→検証の繰り返しで適用の仕方を検討
① ある程度の期間が必要 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 16 いきなり機械学習・異常検知ではなく まず準備・検討したい
仮説→検証を繰り返したい Copyright © Acroquest Technology Co., Ltd. All rights reserved.
17 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用 いきなりの適用は避けたい そんなに 期間 取れないよ?
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 18
仮説→検証を繰り返したい Copyright © Acroquest Technology Co., Ltd. All rights reserved.
19 エンジニアが持つ進め方のイメージ 顧客が持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 データ 収集 異常検知 適用 フィード バック 何度も繰り返す 何度も繰り返す 何回か繰り返す 機械学習適用 機械学習 適用 いきなりの適用は不可 期間的に不可 「PoCで開始」をよく 言われてしまう現場で どのように進めたら良いか?
一旦初心に返る 1. 達成したいゴールは何か? ① 発生している異常の「検知」、「予兆」 ② 「機械学習による異常検知」はあくまで手法 2. どのようなアプローチで解決できるか? ①
データの確保 – モノによっては異常データが存在しない。日本製のモノは丈夫。壊れないの で異常データが取れない。インフラならなおさら。 ② 傾向分析 ③ 傾向に合わせた異常検知手法の検討 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 20 顧客も巻き込んで 一緒に解決する
Case:製造工場ラインの突然停止を防げ(事件編) 1. 顧客からの要望 ① とある製造工場のラインが突然停止する日々 ② 原因不明。一部のラインの停止で全体に影響 ③ 異常状態の予兆検知をしたい 2.
プロジェクト開始時の状況 ① 取得しているデータ – 正常(と思われる期間の)データ半日分 – 突然停止が発生した前後数時間分 ② センサは「とりあえず」4ヶ所つけた。計測に適した場所かどうかは 顧客もわからない ③ PoCで開始。期間はとりあえず「1ヶ月」 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 21
Case:製造工場ラインの突然停止を防げ(解決編) 1. データの傾向分析 ① 異常状態と正常状態で傾向に差があり – 単位時間あたりのスパイクの数 – スパイク発生時のセンサが示した絶対値 2.
異常状態検知の手法の検討 ① 外れ値検知と複合イベント処理(CEP)で処理可能 3. これらをリアルタイムにデータを取得している処理に適用 Copyright © Acroquest Technology Co., Ltd. All rights reserved. 22 ここまで顧客がイメージしていた 『機械学習』はなし
実際の流れ Copyright © Acroquest Technology Co., Ltd. All rights reserved.
23 1. データ受領後から顧客へのフィードバック速度に注力 ① PoC期間ではフィードバックの繰り返しと手法検討まで、と顧客とも合意した ② フィードバックのループは1週間単位で実施。フィードバック後の動きにも時間 的余裕ができる 2. 何度も「仮説〜フィードバック」を繰り返すことで、顧客も自分たちも問 題に対する理解が深まる。 エンジニアが持つ進め方のイメージ データ 収集 仮説 検証 フィード バック 手法検討 異常検知 適用 何度も繰り返す 何度も繰り返す 機械学習適用
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 24
リーンスタートアップ
フィードバックループが生きる世界 1. リーンスタートアップの「フィードバックループ」が今回のよう な顧客の課題解決に合っている、と実感 2. 顧客もエンジニアも、フィードバックループを通して学習する ことが必要 Copyright © Acroquest
Technology Co., Ltd. All rights reserved. 25 顧客と一体となってビジネスを成長させる
Torrentioを用いたリーンスタートアップ Copyright © Acroquest Technology Co., Ltd. All rights reserved.
26 アイデア 構築 製品 計測 データ 学習 ビジュアルエディタによる高速な構築 →計測・学習で顧客を待たせない。 取得したデータを即可視化 計測時間を短縮 →即フィードバック、学習が可能。
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 27
DEMO
まとめ 1. 顧客とエンジニアが持っている異常検知プロセスの意識合 わせが必要 ① プロジェクト開始時に齟齬を埋める 2. 最小限のリソースで高速にフィードバックループを回し、本当 に現場に必要なソリューションを見出す ①
フィードバックループを得られる「最小限のリソース」が鍵 3. 顧客とエンジニアが一体となってビジネスを成長させる意識 が重要 ① 一緒にビジネスを進める姿勢に顧客も最初から巻き込む Copyright © Acroquest Technology Co., Ltd. All rights reserved. 28
Copyright © Acroquest Technology Co., Ltd. All rights reserved. 29
ご清聴ありがとうございました。 Infrastructures Evolution