Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[輪読]時系列解析入門 第1章
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ysekky
January 27, 2015
Research
1
1k
[輪読]時系列解析入門 第1章
Gunosyデータマイニング研究会 #82 2015/01/27
ysekky
January 27, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
2.3k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.8k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
2.2k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
810
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
3k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.6k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
1.2k
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.4k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
4k
Other Decks in Research
See All in Research
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
230
地域丸ごとデイサービス「Go トレ」の紹介
smartfukushilab1
0
930
生成的情報検索時代におけるAI利用と認知バイアス
trycycle
PRO
0
300
それ、チームの改善になってますか?ー「チームとは?」から始めた組織の実験ー
hirakawa51
0
670
POI: Proof of Identity
katsyoshi
0
140
When Learned Data Structures Meet Computer Vision
matsui_528
1
2.9k
Pythonでジオを使い倒そう! 〜それとFOSS4G Hiroshima 2026のご紹介を少し〜
wata909
0
1.3k
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
120
空間音響処理における物理法則に基づく機械学習
skoyamalab
0
190
[チュートリアル] 電波マップ構築入門 :研究動向と課題設定の勘所
k_sato
0
260
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
Combining Deep Learning and Street View Imagery to Map Smallholder Crop Types
satai
3
580
Featured
See All Featured
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
68
Side Projects
sachag
455
43k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
Skip the Path - Find Your Career Trail
mkilby
0
60
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.6k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
120
New Earth Scene 8
popppiees
1
1.5k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
140
Why Our Code Smells
bkeepers
PRO
340
58k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
120
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Transcript
時系列解析入門 1章 時系列データの解析とその準備 Yoshifumi Seki (Gunosy Inc) 2015.01.27
1.1 時系列データ
1.2 時系列の分類 • 連続時間時系列 – レコーダなどで連続的に記録されたデータ • 離散時間時系列
– 1時間おきなど,ある時間間隔で観測されたデー タ – 等間隔なものと不等間隔な物がある • 殆どの場合は等間隔な離散時間系列データ のことを時系列データという
1.2 時系列の分類 • 一変量時系列(univariate) – 各観測時点で得られる情報が一種類 • 多変量時系列(mul?-‐variate)
– 二つ以上の情報を同時に記録したもの
1.2 時系列の分類 • ガウス型時系列 – 時系列の分布が正規分布に従う • 非ガウス型時系列
– 正規分布に従わない • この本で取り扱うモデルの多くはガウス型時系 列を仮定している • そのままでは扱えなくても,適切な変換を行うこ とによって銀地的にガウス型時系列として扱える 場合もある
1.2 時系列の分類 • 線形時系列 – 線形なモデルの出力として表現できる • 非線形時系列
– 非線形なモデルが必要
1.2 時系列の分類 • 欠測値 – なんらかの理由により値が観測できなかったデー タ • 異常値
– 観測している現象の異常な振る舞い,観測機器 の異常などにより起こる明らかに異常なデータ
1.3 時系列解析の目的 • 記述 – 図示 – 記述統計量を用いて特徴を簡潔に表現する •
標本自己共分散関数 • 標本自己相関関数 • ピリオドグラム • 時系列データはデータの量が多いのでグラフ で表現される
1.3 時系列解析の目的 • モデリング – 時系列の変動の仕方を表現するモデルを構築し, 確率的構造を解析すること – 目的に応じて適切な時系列モデルを選択し,パラ メータを推定する
1.3 時系列解析の目的 • 予測 – 時系列が互いに相関を持つことを利用し,現在ま でに得られたデータから今後の変動を予測する – 推定されたモデルを利用して予測やシミュレー ションを行う
1.3 時系列解析の目的 • 信号抽出 – 目的に応じて必要な信号や情報を取り出すこと
1.4 時系列データの前処理 • 非定常な時系列データを前処理によって定常 化する a) 変数変換 b)
差分(階差) c) 前期比,前年同期比 d) 移動平均
1.4 (a) 変数変換 • 値が大きくなるとその分変動も大きくなることが ある – 金額, 人数など
– 対数化すると分散が一様になったり,誤差分布が正 規分布とみなせる場合がある • 確率や割合のような(0, 1)をとる時系列の場合に はロジット変換によって(-‐∞, ∞)をとる時系列に変 換できる – 分布の歪が少なくなりモデリングが容易になることが 多い
1.4 (b) 差分(階差) • 上昇, 下落のような顕著なトレンドをもつ場合 には差分系列を解析することがある • 仮に直線の場合は時系列が定数になる
• 2次式の場合はさらにznの差分を求めること で2次成分と1次成分を除去できる
1.4 (c) 前期比, 前年同期比 • 経済データなどでよく用いられる • 時系列データがトレンドT, ノイズwの積で表現
され, トレンドは成長率αで変化すると • ノイズの変化を無視できるとすれば成長率を 算出できる
1.4 (c) 前期比, 前年同期比 • 時系列が周期pの周期関数sとノイズwの積と して表される場合には • 周期関数を除去できる
1.4 (d) 移動平均 変動の激しい時系列を滑らかにする 元の時系列が直線とノイズの和で表されるとき 平均はa+bn, 分散はwの分散の1/(2k+1となる)