Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[輪読]時系列解析入門 第1章
Search
ysekky
January 27, 2015
Research
1
1k
[輪読]時系列解析入門 第1章
Gunosyデータマイニング研究会 #82 2015/01/27
ysekky
January 27, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2.2k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.7k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2.1k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
760
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
2.8k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.5k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.1k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.3k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
3.9k
Other Decks in Research
See All in Research
在庫管理のための機械学習と最適化の融合
mickey_kubo
3
1.1k
Self-supervised audiovisual representation learning for remote sensing data
satai
3
230
Trust No Bot? Forging Confidence in AI for Software Engineering
tomzimmermann
1
250
RapidPen: AIエージェントによるペネトレーションテスト 初期侵入全自動化の研究
laysakura
0
1.6k
20250502_ABEJA_論文読み会_スライド
flatton
0
180
引力・斥力を制御可能なランダム部分集合の確率分布
wasyro
0
190
(NULLCON Goa 2025)Windows Keylogger Detection: Targeting Past and Present Keylogging Techniques
asuna_jp
2
550
GeoCLIP: Clip-Inspired Alignment between Locations and Images for Effective Worldwide Geo-localization
satai
3
250
学生向けアンケート<データサイエンティストについて>
datascientistsociety
PRO
0
3.8k
データサイエンティストの就労意識~2015→2024 一般(個人)会員アンケートより
datascientistsociety
PRO
0
710
Collaborative Development of Foundation Models at Japanese Academia
odashi
2
560
定性データ、どう活かす? 〜定性データのための分析基盤、はじめました〜 / How to utilize qualitative data? ~We have launched an analysis platform for qualitative data~
kaminashi
7
1.1k
Featured
See All Featured
Speed Design
sergeychernyshev
32
1k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.8k
A Tale of Four Properties
chriscoyier
160
23k
A Modern Web Designer's Workflow
chriscoyier
695
190k
Build The Right Thing And Hit Your Dates
maggiecrowley
36
2.8k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Optimising Largest Contentful Paint
csswizardry
37
3.3k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
2.9k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
6
320
For a Future-Friendly Web
brad_frost
179
9.8k
Practical Orchestrator
shlominoach
189
11k
Transcript
時系列解析入門 1章 時系列データの解析とその準備 Yoshifumi Seki (Gunosy Inc) 2015.01.27
1.1 時系列データ
1.2 時系列の分類 • 連続時間時系列 – レコーダなどで連続的に記録されたデータ • 離散時間時系列
– 1時間おきなど,ある時間間隔で観測されたデー タ – 等間隔なものと不等間隔な物がある • 殆どの場合は等間隔な離散時間系列データ のことを時系列データという
1.2 時系列の分類 • 一変量時系列(univariate) – 各観測時点で得られる情報が一種類 • 多変量時系列(mul?-‐variate)
– 二つ以上の情報を同時に記録したもの
1.2 時系列の分類 • ガウス型時系列 – 時系列の分布が正規分布に従う • 非ガウス型時系列
– 正規分布に従わない • この本で取り扱うモデルの多くはガウス型時系 列を仮定している • そのままでは扱えなくても,適切な変換を行うこ とによって銀地的にガウス型時系列として扱える 場合もある
1.2 時系列の分類 • 線形時系列 – 線形なモデルの出力として表現できる • 非線形時系列
– 非線形なモデルが必要
1.2 時系列の分類 • 欠測値 – なんらかの理由により値が観測できなかったデー タ • 異常値
– 観測している現象の異常な振る舞い,観測機器 の異常などにより起こる明らかに異常なデータ
1.3 時系列解析の目的 • 記述 – 図示 – 記述統計量を用いて特徴を簡潔に表現する •
標本自己共分散関数 • 標本自己相関関数 • ピリオドグラム • 時系列データはデータの量が多いのでグラフ で表現される
1.3 時系列解析の目的 • モデリング – 時系列の変動の仕方を表現するモデルを構築し, 確率的構造を解析すること – 目的に応じて適切な時系列モデルを選択し,パラ メータを推定する
1.3 時系列解析の目的 • 予測 – 時系列が互いに相関を持つことを利用し,現在ま でに得られたデータから今後の変動を予測する – 推定されたモデルを利用して予測やシミュレー ションを行う
1.3 時系列解析の目的 • 信号抽出 – 目的に応じて必要な信号や情報を取り出すこと
1.4 時系列データの前処理 • 非定常な時系列データを前処理によって定常 化する a) 変数変換 b)
差分(階差) c) 前期比,前年同期比 d) 移動平均
1.4 (a) 変数変換 • 値が大きくなるとその分変動も大きくなることが ある – 金額, 人数など
– 対数化すると分散が一様になったり,誤差分布が正 規分布とみなせる場合がある • 確率や割合のような(0, 1)をとる時系列の場合に はロジット変換によって(-‐∞, ∞)をとる時系列に変 換できる – 分布の歪が少なくなりモデリングが容易になることが 多い
1.4 (b) 差分(階差) • 上昇, 下落のような顕著なトレンドをもつ場合 には差分系列を解析することがある • 仮に直線の場合は時系列が定数になる
• 2次式の場合はさらにznの差分を求めること で2次成分と1次成分を除去できる
1.4 (c) 前期比, 前年同期比 • 経済データなどでよく用いられる • 時系列データがトレンドT, ノイズwの積で表現
され, トレンドは成長率αで変化すると • ノイズの変化を無視できるとすれば成長率を 算出できる
1.4 (c) 前期比, 前年同期比 • 時系列が周期pの周期関数sとノイズwの積と して表される場合には • 周期関数を除去できる
1.4 (d) 移動平均 変動の激しい時系列を滑らかにする 元の時系列が直線とノイズの和で表されるとき 平均はa+bn, 分散はwの分散の1/(2k+1となる)