Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ストリーミング時系列データの効率的なモチーフモニタリングアルゴリズム / Monitoring...
Search
Shinya Kato
July 06, 2018
Research
190
0
Share
ストリーミング時系列データの効率的なモチーフモニタリングアルゴリズム / Monitoring Range Motif on Streaming Time-Series, presented at DICOMO 2018
Shinya Kato
July 06, 2018
More Decks by Shinya Kato
See All by Shinya Kato
PostgreSQLのVisibilityの仕組み
shinyakato_
4
890
pg_bigmをRustで実装する(第50回PostgreSQLアンカンファレンス@オンライン 発表資料)
shinyakato_
0
310
多次元ストリーミング時系列データの効率的なモチーフモニタリングアルゴリズム / Monitoring Motif on Multi-dimensional Streaming Time-series, presented at DPSWS 2019
shinyakato_
0
48
Discord Monitoring for Streaming Time-series, presented at DEXA 2019
shinyakato_
0
39
ストリーミング時系列データの効率的なディスコードモニタリングアルゴリズム / Discord Monitoringfor Streaming Time-series, presented at DEIM 2019
shinyakato_
0
39
Monitoring Range Motif on Streaming Time-Series, presented at DEXA 2018
shinyakato_
0
30
Other Decks in Research
See All in Research
【SIGGRAPH Asia 2025】Lo-Fi Photograph with Lo-Fi Communication
toremolo72
0
150
オーストリア流 都市の公共交通サービス水準評価@公共交通オープンデータ最前線2026
trafficbrain
0
140
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
320
The Landscape of Agentic Reinforcement Learning for LLMs: A Survey
shunk031
4
870
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
890
Ankylosing Spondylitis
ankh2054
0
160
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2.1k
LLM の Attention 機構まとめ — 数式・計算量・メモリ
puwaer
5
1.3k
「車1割削減、渋滞半減、公共交通2倍」を 熊本から岡山へ@RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
1
1k
Tiaccoon: Unified Access Control with Multiple Transports in Container Networks
hiroyaonoe
0
1.5k
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
mssmkmr
0
460
はじまりの クエスチョンブック —余暇と豊かさにあふれた社会とは?
culturaltransition
PRO
0
370
Featured
See All Featured
A better future with KSS
kneath
240
18k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.4k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
810
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.5k
Building AI with AI
inesmontani
PRO
1
910
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Facilitating Awesome Meetings
lara
57
6.8k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.7k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
43k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
69
39k
Visualization
eitanlees
150
17k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Transcript
ストリーミング時系列データの 効率的なモチーフモニタリングアルゴリズム 加藤 慎也,天方 大地,西尾 俊哉,原 隆浩 大阪大学 大学院情報科学研究科
研究背景(1/2) ◼近年,多くの時系列データが収集 1 家電の消費電力 温室効果ガスの排出量 心電図 異常検知 環境モニタリング 不整脈の発見 分析
研究背景(2/2) ◼モチーフ 時系列データの中に繰り返し現れるパターン 2 予測 異常 モチーフを用いて時系列データを分析
予備知識 ◼類似サブシーケンス 𝑑(𝑠𝑖 , 𝑠𝑗 ) ≤ 𝑅 ⇔ 𝑠𝑖
と𝑠𝑗 は類似サブシーケンス ◼スコア 類似サブシーケンスの数 ◼モチーフ スコアが最大のサブシーケンス[1] 3 ≤ 𝑅 ≤ 𝑅 ≤ 𝑅 スコア = 𝟑 [1] Patel, P., Keogh, E., Lin, J. and Lonardi, S.: Mining motifs in massive time series databases (2002)
問題定義 ◼スライディングウィンドウ上で ストリーミング時系列データのモチーフをモニタリング データが発生するたびウィンドウをスライド 最新の𝑤個の値のみを考慮 4 ウィンドウ 古い値は 考慮しない. ウィンドウ
ウィンドウ ウィンドウ データ発生 データ発生 データ発生 ウィンドウ
◼ウィンドウのスライドにより 削除されるサブシーケンス 挿入されるサブシーケンス と 全サブシーケンスとの距離計算することによりスコア更新 ベースラインアルゴリズム 5 ウィンドウ データ発生 データ削除
⋯ 削除される サブシーケンス 挿入される サブシーケンス 距離計算 距離計算 ⋯ 【研究目的】 ウィンドウがスライドした際の スコアの更新を高速化し, モチーフを効率的にモニタリングする.
提案アルゴリズムSRMM(Streaming Range Motif Monitoring) つまり,挿入されるサブシーケンスを𝑠𝑛 とすると 𝒔𝒏 のスコア<モチーフのスコア がわかれば,モチーフが更新されないことがわかる. ◼SRMMの流れ
6 モチーフ(スコア最大のサブシーケンス)をモニタリングが 問題定義 PAA 𝒌𝒅木に 挿入 ⋮ 距離𝑅以上のサブシーケンス を高速に特定 スコアの上界値を高速に計算
SRMM - PAA ◼PAA[2]によりサブシーケンスを長さ𝑙から𝜙に圧縮 7 𝑙 𝜙 𝑠𝑖 𝑠 𝑖
𝜙 𝑠𝑗 𝑠 𝑗 𝜙 𝑑(𝑠𝑖 , 𝑠𝑗 ) 𝑑(𝑠 𝑖 𝜙, 𝑠 𝑗 𝜙) PAA ≥ ≥ 𝑅 𝒔𝒊 と𝒔𝒋 は類似サブシーケンスでない! 𝑂(𝑙) 𝑂(𝜙) [2] Keogh, E.: Dimensionality reduction for fast similarity search in large time series databases (2001)
SRMM – 範囲検索 ◼𝑠 𝑖 𝜙 = (𝑡 𝑖 𝜙,
𝑡 𝑖+1 𝜙 , ⋯ , 𝑡 𝑖+𝜙−1 𝜙 )は𝜙次元上の点として表現 ◼距離𝑅以内のサブシーケンスの数=スコアの上界値 8 𝜙次元 𝑠𝑛 𝜙 全計算 𝑂(𝜙) × 𝑤 = 𝑂(𝜙𝑤) 𝒌𝒅木による範囲検索 𝑶 𝝓 𝐥𝐨𝐠 𝒘 𝜙次元 𝑠𝑛 𝜙 スコアの上界値5
SRMM – モチーフ更新の例 ◼𝑠𝑛 のスコアの上界値2 < モチーフのスコア3 𝑠𝑛 はモチーフにならない. ◼𝑠𝑛
のスコアの上界値5 > モチーフのスコア3 𝑠𝑛 はモチーフになり得るため,正確なスコアの計算を行う. 9 𝑠𝑛 𝜙 𝑠𝑎 𝜙 𝑠𝑐 𝜙 𝑠 𝑑 𝜙 𝑠𝑒 𝜙 𝑠 𝑏 𝜙 𝑑(𝑠𝑛 , 𝑠𝑎 ) 𝑑(𝑠𝑛 , 𝑠𝑑 ) 𝑑(𝑠𝑛 , 𝑠𝑒 ) 𝑑(𝑠𝑛 , 𝑠𝑏 ) 𝑑(𝑠𝑛 , 𝑠𝑐 ) < 𝑅 > 𝑅 𝑑(𝑠𝑛 , 𝑠𝑒 ) 𝑑(𝑠𝑛 , 𝑠𝑎 ) 𝑑(𝑠𝑛 , 𝑠𝑑 ) 𝑑(𝑠𝑛 , 𝑠𝑏 ) 𝑑(𝑠𝑛 , 𝑠𝑐 ) 𝒔𝒏 のスコアは1 ⇒モチーフは更新されない.
SRMM – サブシーケンスの削除 ◼削除されるサブシーケンス𝑠𝑒 と 類似するサブシーケンスのスコアの上界値が1減少 ◼各サブシーケンスが類似サブシーケンスのリストを保持 サブシーケンス挿入時に作成 10 𝑠𝑒
𝜙 𝑠𝑝 𝜙 𝑠𝑞 𝜙 𝑠𝑟 𝜙 𝑠𝑒 : 𝑠𝑝 , 𝑠𝑞 , 𝑠𝑟 𝑠𝑝 : 𝑠𝑒 , ⋯ 𝑠𝑞 : 𝑠𝑒 , ⋯ 𝑠𝑟 : 𝑠𝑒 , ⋯ 𝒔𝒆 を𝒔𝒑 , 𝒔𝒒 , 𝒔𝒓 のリストから削除し スコアの上界値を1減少 削除 削除 削除
評価 ◼データセット GreenHouseGas, RefrigerationDevices ◼パラメータ ◼比較手法 ベースラインアルゴリズム ◼評価指標 更新時間 11
ウィンドウサイズ𝑤 [× 103] 5, 10, 15, 20 モチーフ長𝑙 50, 100, 150, 200 ピアソン相関の閾値𝜃 0.75, 0.8, 0.85, 0.9, 0.95 Rは以下の式で計算 𝑅 = 2𝑙(1 − 𝜃)
ウィンドウサイズ𝑤の影響 12 0 20 40 60 80 5 10 15
20 更新時間[msec] ウィンドウサイズ[×103] ベースライン SRMM 0 20 40 60 80 5 10 15 20 更新時間[msec] ウィンドウサイズ[×103] ベースライン SRMM SRMMはベースラインよりも高速 GreenHouseGas RefrigerationDevices
0 20 40 60 80 50 100 150 200 更新時間[msec]
モチーフ長 ベースライン SRMM 0 20 40 60 80 50 100 150 200 更新時間[msec] モチーフ長 ベースライン SRMM モチーフ長𝑙の影響 13 SRMMはモチーフ長によらず高速 GreenHouseGas RefrigerationDevices
0 20 40 60 0.75 0.8 0.85 0.9 0.95 更新時間[msec]
閾値θ ベースライン SRMM 0 20 40 0.75 0.8 0.85 0.9 0.95 更新時間[msec] 閾値θ ベースライン SRMM 閾値𝜃の影響 14 SRMMは閾値が大きいほど高速 GreenHouseGas RefrigerationDevices Rは以下の式で計算 𝑅 = 2𝑙(1 − 𝜃)
まとめ ◼ストリーミング時系列データの 効率的なモチーフモニタリングアルゴリズムSRMMの提案 PAAおよび範囲検索を用いることにより, 不要なスコアの計算を削減 類似サブシーケンスのリストを保持することにより, スコアの減少するサブシーケンスを高速に特定 ◼評価実験からSRMMの有効性を確認 ◼今後の課題 多次元時系列データへの対応
15