Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データのマスタが変わっても継続的に分析したい!

 データのマスタが変わっても継続的に分析したい!

Kyoto Tech Talk #5 (https://lycorptech-jp.connpass.com/event/320723/) の発表資料です

momochi29

June 25, 2024
Tweet

More Decks by momochi29

Other Decks in Programming

Transcript

  1. 自己紹介 2 • id: momochi29 • 所属: 株式会社はてな マンガメディア開発チーム •

    職種: Webアプリケーションエンジニア • 好きなマンガ: ワールドトリガー
  2. 結果 21 • 課題もあったが今は元気に動いている ◦ バックフィル(初期化処理)が遅すぎる ▪ 20億レコードのバックフィルに10日かかる ▪ Auroraのスナップショットでバックフィルして1日に短縮できた

    ◦ 前日分の変更が反映されているのか不明 ▪ データの鮮度を指定できるがいつ更新されるのかわからない ▪ 鮮度のパラメータ(max_staleness)を動的に変更することで確実に 変更を反映させることができた
  3. 結果 22 • 課題もあったがなんとかなった ◦ バックフィル(初期化処理)が遅すぎる ▪ 20億レコードのバックフィルに10日かかる ▪ Auroraのスナップショットでバックフィルして1日に短縮できた

    ◦ 前日分の変更が反映されているのか不明 ▪ データの鮮度を指定できるがいつ更新されるのかわからない ▪ 鮮度のパラメータ(max_staleness)を動的に変更することで確実 に変更を反映させることができた 詳しくはブログに 書いています/書く予定です! https://tjmtmmnk.hatenablog.com /search?q=Datastream
  4. tbls • データベースに接続し て良い感じに定義書を 作ってくれる • 設定が柔軟 ◦ コメントの上書き ◦

    ER図を外部キーなし でも作れる 43 https://github.com/k1LoW/tbls/blob/main/sample/mysql/logs.md