Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
時系列分析と状態空間モデリングの基礎 / Foundations of Time Series...
Search
masso
December 17, 2020
Science
1
610
時系列分析と状態空間モデリングの基礎 / Foundations of Time Series Analysis and State Space Models 0
masso
December 17, 2020
Tweet
Share
More Decks by masso
See All by masso
Stacktrace for rs/zerolog users
masso
0
300
データ解釈学入門 第一部 / Data hermeneutics Part 1
masso
8
2.2k
わかりやすいパターン認識2章 / Pattern Recognition Manual Easy to understand SS 02
masso
0
980
分析環境紹介LT / the introduction of as my analysis env is
masso
0
120
わかりやすいパターン認識1章 / Pattern Recognition Manual Easy to understand SS 01
masso
0
180
データ解析のための統計モデリング入門6章 / Handbook-of-statistical-modeling-for-data-analysis-section6
masso
0
540
DLGが目指すコミュニティの形 / DLG Community Objective
masso
0
2.6k
PowerAutomateによる社員健康状態集計システム / Employee health status tabulation system with Power Automate
masso
0
1.5k
Other Decks in Science
See All in Science
データベース11: 正規化(1/2) - 望ましくない関係スキーマ
trycycle
PRO
0
680
データベース06: SQL (3/3) 副問い合わせ
trycycle
PRO
1
550
データベース01: データベースを使わない世界
trycycle
PRO
1
670
データベース04: SQL (1/3) 単純質問 & 集約演算
trycycle
PRO
0
870
研究って何だっけ / What is Research?
ks91
PRO
1
100
[第62回 CV勉強会@関東] Long-CLIP: Unlocking the Long-Text Capability of CLIP / kantoCV 62th ECCV 2024
lychee1223
1
950
KH Coderチュートリアル(スライド版)
koichih
1
41k
システム数理と応用分野の未来を切り拓くロードマップ・エンターテインメント(スポーツ)への応用 / Applied mathematics for sports entertainment
konakalab
1
340
04_石井クンツ昌子_お茶の水女子大学理事_副学長_D_I社会実現へ向けて.pdf
sip3ristex
0
510
Cross-Media Information Spaces and Architectures (CISA)
signer
PRO
3
31k
Quelles valorisations des logiciels vers le monde socio-économique dans un contexte de Science Ouverte ?
bluehats
1
420
LayerXにおける業務の完全自動運転化に向けたAI技術活用事例 / layerx-ai-jsai2025
shimacos
2
1.2k
Featured
See All Featured
Building a Scalable Design System with Sketch
lauravandoore
462
33k
Intergalactic Javascript Robots from Outer Space
tanoku
271
27k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.4k
How to Think Like a Performance Engineer
csswizardry
25
1.7k
It's Worth the Effort
3n
185
28k
Mobile First: as difficult as doing things right
swwweet
223
9.7k
Side Projects
sachag
455
42k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
8
700
Measuring & Analyzing Core Web Vitals
bluesmoon
7
510
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
6
310
Transcript
基礎からわかる時系列分析 輪読会 第5回 〜ちょっと⽴ち⽌まって基本を学ぶ回〜
すいません、違う本の内容を紹介させてください (エクストリームすぎるだろw というツッコミ待ち) ✋
なぜ別の本を持ち出したか • 時系列分析の基本がわからなすぎて前回ついて いけなかった • 『基礎からわかる時系列分析』の場合、 AR/MA/ARMA/ARIMAあたりを丁寧に解説して いるところがなかった(そこを知りたい…) • 今回紹介する本は、そこんとこを優しく解説し
てくれてた
お品書き ① 時系列データを表現する上での基本 ② データの⽣成過程〜定常過程・⾮定常過程 ③ ARIMAモデルとはなんだ〜有⾺さんじゃないよ
時系列データを表現する上での 基本 『時系列分析と状態空間モデルの基礎』1部2章付近
学ぶ⽤語⼀覧 • ⾃⼰相関とコレログラム • 季節成分・周期成分 • トレンド • 外因性 •
ホワイトノイズ
⾃⼰相関とコレログラム ⾃⼰相関 過去の⾃分との相関。 時系列じゃない場合は、説 明変数XとYの相関Cov(x,y) とか考えるけど、時系列は、 ⾃分との相関Cov(Xt, Xt-1) を考える点が特徴といえる ⾃⼰相関係数(ACF)と
偏⾃⼰相関係数(PACF)がある コレログラム 何時点前との⾃⼰相関が強 いのかを判断するのに使わ れる作図⽅法
季節成分・周期成分 • 常にN時点前のデータと強い相関がある場合、 周期性があると⾔える • 単に、「⾃⼰相関がある」と捉えるだけで終わ らせてはいけない • 特に1年単位の周期があるもの(12ヶ⽉前と 強い相関がある)ものを季節性と呼ぶ
• 他にも週単位、⽇単位の周期性もある
トレンド • 例えば、「毎⽉の売上が20万円ずつ上昇する ような右肩上がりの業績データ」であれば、正 のトレンドがあるなどという • もう少し⼀般的な表現をするなら、「中⻑期的 なデータの単調変化(増加・減少)」とも⾔え るかも
外因性 • 外部の要因によるもの、例えば「近くでイベン トが⾏われたので売上が際⽴って⾼い⽇」の データなどは、外因性によるデータの振る舞い といえる • もう少し⼀般的な表現をするなら、「分析対象 としている『系』の外のイベントによる影響」 と⾔えそう
ホワイトノイズ • 純粋なノイズ。予測不可能と考えてよい。 • 具体的な条件は – 期待値が0 & 分散が⼀定 &
⾃⼰相関が0 • よく使われるのは、平均0で分散σ2の正規分布
時系列データの構造 時系列データ = 短期の⾃⼰相関 + 周期的変動(季節性含む) + トレンド + 外因性
+ ホワイトノイズ
データの⽣成過程 〜定常過程・⾮定常過程 『時系列分析と状態空間モデルの基礎』2部2章付近
特徴と定義 定常過程 ⾮定常過程 • 分析しやすい • 時点によらず期待値が⼀定 & 時点に よらず⾃⼰共分散・⾃⼰相関が時点差
のみに依存 • 分析しにくい • 定常過程以外の全て(現実はこっちが 多い)
定常過程が分析しやすい理由 • 基本統計量は以下のように表せる • これが時点によって変わらないので、ある区間(例えば1ヶ ⽉分)のデータから算出した期待値や分散がそのまま「特定 時点の期待値や分散の推定量」とみなせる • 定常過程データに対して(後述の)ARMAモデルが⾼い説明 能⼒を持つ
⾮定常過程のデータを扱いやすく変換する • 差分をとる→トレンドを消せる – d階差分をとると定常過程に変化するものをd次和分過程という
⾮定常過程のデータを扱いやすく変換する • 対数をとる→和が積になる。解釈内容が変わる。 時系列データ=周期的変動+トレンド+ホワイトノイズ log時系列データ=log周期的変動+logトレンド+logホワイトノイズ log(時系列データ)=log(周期的変動×トレンド×ホワイトノイズ)
ARIMAモデルとはなんだ 〜有⾺さんじゃないよ 『時系列分析と状態空間モデルの基礎』2部3・4章付近
結論 • AR(⾃⼰回帰)モデル • MA(移動平均)モデル • I(d)︓d次和分過程 • ARIMA=AR+I(d)+MA
⾃⼰回帰モデル • AR(⾃⼰回帰)モデル • MA(移動平均)モデル • I(d)︓d次和分過程 • ARIMA=AR+I(d)+MA
移動平均モデル • AR(⾃⼰回帰)モデル • MA(移動平均)モデル • I(d)︓d次和分過程 • ARIMA=AR+I(d)+MA 係数が1より⼩のAR(1)
はMA(∞)に等しい という関係がある
ARMA • AR + MA(⾃⼰回帰移動平均)モデル • p次のARモデルとq次のMAモデルはARMA(p,q) • ⾃⼰相関をより柔軟に表現できる
d次和分過程 • AR(⾃⼰回帰)モデル • MA(移動平均)モデル • I(d)︓d次和分過程 • ARIMA=AR+I(d)+MA d階差分するとはじめて定常過程になる
⾮定常過程のこと 何階差分をとれば⼗分なのかは単位根検定によっ て判断する
ARIMAモデル • AR(⾃⼰回帰)モデル • MA(移動平均)モデル • I(d)︓d次和分過程 • ARIMA=AR+I(d)+MA d次和分過程のデータをd階差分して、
定常過程に変換した上で、ARMAを適⽤する 次数p,d,qを⽤いてARIMA(p,d,q)と表現する
ARIMAの拡張 • SARIMA モデル=ARIMA+Seasonal(季節性) • ARIMAX モデル=ARIMA+Exogenous(外因性)
SARIMA • SARIMA モデル=ARIMA+Seasonal(季節性) • ARIMAX モデル=ARIMA+Exogenous(外因性) ⽉単位のデータを例に取ると データを前年同期ごとにとり、「去年との相関関係」をモ デル化する
1周期がsのデータにおいて、ARIMAの次数(p,d,q)、 季節性の次数(P,D,Q)として、SARIMA(p,d,q)(P,D,Q)[s] と表現する
ARIMAX • SARIMA モデル=ARIMA+Seasonal(季節性) • ARIMAX モデル=ARIMA+Exogenous(外因性) 回帰の要素をいれたARIMAといえる。 ある店舗のの売上が、近くで⼤きなイベントが開催され たために急激に増加した場合を考慮するときとか
また、曜⽇や祝⽇の効果をモデルに組み込むときも使われ ることがある。SARIMAと異なりダミー変数(祝⽇フラグ とか)で様々なパターンが作れるので、季節性のデータで もARIMAXでモデル化した⽅が楽なときもある。
まとめ
補⾜
SARIMAの数式表現 結論 導出
ARIMAXの数式表現