Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[輪読]時系列解析入門 第1章
Search
ysekky
January 27, 2015
Research
1
890
[輪読]時系列解析入門 第1章
Gunosyデータマイニング研究会 #82 2015/01/27
ysekky
January 27, 2015
Tweet
Share
More Decks by ysekky
See All by ysekky
スタートアップの開発サイクルに学ぶ 研究活動の進め方 / research practices inspired by startup business strategy
ysekky
0
1.7k
[論文紹介] A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets (Recsys2020) / recsys20-reading-gunosy-datapub
ysekky
3
2.4k
JSAI2020 OS-12 広告とAI オープニング / JSAI2020-OS-12-ads-and-ai-opening
ysekky
0
1.8k
JSAI2020インダストリアルセッション - Gunosyにおける研究開発 / jsai2020-gunosy-rd-examples
ysekky
1
710
ウェブサービス事業者における研究開発インターン[株式会社Gunosy] - テキストアナリティクスシンポジウム2019 / research-intern-case-study-at-gunosy
ysekky
0
2.4k
Gunosyにおけるニュース記事推薦/ news-recommendation-in-gunosy-webdbf2019
ysekky
1
1.3k
DEIM2019技術報告セッション - Gunosyの研究開発 / deim-2019-sponsor-session-gunosy-research
ysekky
0
850
Analysis of Bias in Gathering Information Between User Attributes in News Application (ABCCS 2018)
ysekky
1
2.1k
世代による政治ニュース記事の閲覧傾向の違いの分析 - JSAI2018 / Analysis of differences in viewing behavior of politics news by age
ysekky
0
3.7k
Other Decks in Research
See All in Research
オープンな日本語埋め込みモデルの選択肢 / Exploring Publicly Available Japanese Embedding Models
nttcom
13
5.2k
Cross-Media Information Spaces and Architectures
signer
PRO
0
120
Experiments on ROP Attack with Various Instruction Set Architectures
yumulab
0
320
言語間転移学習で大規模言語モデルを賢くする
ikuyamada
6
1.8k
眠眠ガチャ:ガチャを活用した睡眠意欲向上アプリの開発 / EC71inui
yumulab
0
120
NeurIPS-23 参加報告 + DPO 解説
akifumi_wachi
4
1.4k
センサデータを活用した 肌質改善への支援システムに関する研究
comfortdesignlab
0
150
Equivalence of Geodesics and Importance Weighting from the Perspective of Information Geometry
mkimura
0
130
Azure Arc-enabled Serversを利用した ハイブリッド・マルチクラウド環境の管理 / Managing Hybrid Multi-cloud Environments with Azure Arc-enabled Servers
nttcom
0
210
CASCON 2023 Most Influential Paper Award Talk
tsantalis
0
110
「歴史的農業環境閲覧システム」と「迅速測図」について
wata909
1
580
Alexander Mielke Hellinger--Kantorovich (a.k.a. Wasserstein-Fisher-Rao) Spaces and Gradient Flows
jjzhu
3
180
Featured
See All Featured
The Mythical Team-Month
searls
215
42k
The Cost Of JavaScript in 2023
addyosmani
14
3.8k
Stop Working from a Prison Cell
hatefulcrawdad
266
19k
Imperfection Machines: The Place of Print at Facebook
scottboms
258
12k
Unsuck your backbone
ammeep
662
57k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
226
16k
Navigating Team Friction
lara
177
13k
BBQ
matthewcrist
80
8.7k
Clear Off the Table
cherdarchuk
83
310k
A Philosophy of Restraint
colly
196
16k
KATA
mclloyd
14
12k
Scaling GitHub
holman
457
140k
Transcript
時系列解析入門 1章 時系列データの解析とその準備 Yoshifumi Seki (Gunosy Inc) 2015.01.27
1.1 時系列データ
1.2 時系列の分類 • 連続時間時系列 – レコーダなどで連続的に記録されたデータ • 離散時間時系列
– 1時間おきなど,ある時間間隔で観測されたデー タ – 等間隔なものと不等間隔な物がある • 殆どの場合は等間隔な離散時間系列データ のことを時系列データという
1.2 時系列の分類 • 一変量時系列(univariate) – 各観測時点で得られる情報が一種類 • 多変量時系列(mul?-‐variate)
– 二つ以上の情報を同時に記録したもの
1.2 時系列の分類 • ガウス型時系列 – 時系列の分布が正規分布に従う • 非ガウス型時系列
– 正規分布に従わない • この本で取り扱うモデルの多くはガウス型時系 列を仮定している • そのままでは扱えなくても,適切な変換を行うこ とによって銀地的にガウス型時系列として扱える 場合もある
1.2 時系列の分類 • 線形時系列 – 線形なモデルの出力として表現できる • 非線形時系列
– 非線形なモデルが必要
1.2 時系列の分類 • 欠測値 – なんらかの理由により値が観測できなかったデー タ • 異常値
– 観測している現象の異常な振る舞い,観測機器 の異常などにより起こる明らかに異常なデータ
1.3 時系列解析の目的 • 記述 – 図示 – 記述統計量を用いて特徴を簡潔に表現する •
標本自己共分散関数 • 標本自己相関関数 • ピリオドグラム • 時系列データはデータの量が多いのでグラフ で表現される
1.3 時系列解析の目的 • モデリング – 時系列の変動の仕方を表現するモデルを構築し, 確率的構造を解析すること – 目的に応じて適切な時系列モデルを選択し,パラ メータを推定する
1.3 時系列解析の目的 • 予測 – 時系列が互いに相関を持つことを利用し,現在ま でに得られたデータから今後の変動を予測する – 推定されたモデルを利用して予測やシミュレー ションを行う
1.3 時系列解析の目的 • 信号抽出 – 目的に応じて必要な信号や情報を取り出すこと
1.4 時系列データの前処理 • 非定常な時系列データを前処理によって定常 化する a) 変数変換 b)
差分(階差) c) 前期比,前年同期比 d) 移動平均
1.4 (a) 変数変換 • 値が大きくなるとその分変動も大きくなることが ある – 金額, 人数など
– 対数化すると分散が一様になったり,誤差分布が正 規分布とみなせる場合がある • 確率や割合のような(0, 1)をとる時系列の場合に はロジット変換によって(-‐∞, ∞)をとる時系列に変 換できる – 分布の歪が少なくなりモデリングが容易になることが 多い
1.4 (b) 差分(階差) • 上昇, 下落のような顕著なトレンドをもつ場合 には差分系列を解析することがある • 仮に直線の場合は時系列が定数になる
• 2次式の場合はさらにznの差分を求めること で2次成分と1次成分を除去できる
1.4 (c) 前期比, 前年同期比 • 経済データなどでよく用いられる • 時系列データがトレンドT, ノイズwの積で表現
され, トレンドは成長率αで変化すると • ノイズの変化を無視できるとすれば成長率を 算出できる
1.4 (c) 前期比, 前年同期比 • 時系列が周期pの周期関数sとノイズwの積と して表される場合には • 周期関数を除去できる
1.4 (d) 移動平均 変動の激しい時系列を滑らかにする 元の時系列が直線とノイズの和で表されるとき 平均はa+bn, 分散はwの分散の1/(2k+1となる)