Upgrade to Pro — share decks privately, control downloads, hide ads and more …

時系列クラスタリング

 時系列クラスタリング

Transcript

  1. 0
    時系列クラスタリング
    2022-10-28 第19回NearMe技術勉強会
    Hazuki / Shibayama

    View full-size slide

  2. 1
    目次
    1. 時系列データとは
    2. クラスタリングとは
    3. 時系列クラスタリングの種類
    4. 時系列データの類似性

    View full-size slide

  3. 2
    時系列データとは
    ● 時系列データ
    時間的な変化を、連続的に観測して得られた値の系列
      
     例:
    ○ 金融ー株価、為替レート
    ○ 生物学ー遺伝子発現データ
    ○ 医学ー血圧、心電図
    ○ 生産物流ー需要、売上、生産
    etc

    View full-size slide

  4. 3
    クラスタリングとは
    ● クラスタリング
    類似したデータを関連するグループまたは同種のグループに分ける
    ○ 非階層
       K-means、pLSI、SOM etc
    ○ 階層
       ウォード法、群平均法 etc
    ● 時系列クラスタリング
    似ている時系列データを分ける

    View full-size slide

  5. 4
    ● 時系列クラスタリング
    ○ 形状ベース
    時系列データそのものをクラスタリング
    ○ 特徴ベース
    時系列データを低次元の特徴量ベクトルに落とし込んでからクラスタリング
    ○ モデルベース
    時系列データをパラメトリックなモデルのパラメータに変換して、
    複数のパラメータに対してクラスタリング手法を用いてクラスタリング
    時系列クラスタリングの種類

    View full-size slide

  6. 5
    時系列データの類似性
    ● 各時刻における系列値
    ○ ユークリッド距離→短期データ向き
    ● 系列の形状
    ○ DTW(Dynamic Time Warping)
     →短期データ向き
    ● 系列の変化の特徴
    ○ モデルのパラメータや特徴量等で
     類似度を測定
     →長期データ向き
    形も時点も一緒
    形は似ているが、ずれている
    何をもとに2つの時系列が似ているとするのか?
    自己回帰のパターン、
    トレンドや周期等が似ている

    View full-size slide

  7. 6
    Aghabozorgi, S., Shirkhorshidi, A.S., and Wah, T.Y. (2015)
    Time-series clustering – A decade review. Information Systems, 53, 16-38.
    参考文献

    View full-size slide