Upgrade to Pro — share decks privately, control downloads, hide ads and more …

GCPでのバッチ処理パターンを考えてみる

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.
Avatar for SatohJohn SatohJohn
December 15, 2022

 GCPでのバッチ処理パターンを考えてみる

Avatar for SatohJohn

SatohJohn

December 15, 2022
Tweet

More Decks by SatohJohn

Other Decks in Programming

Transcript

  1. 使えそうなGCPサービスの例 - Cloud Schedulerを使う - Cloud Functions - Cloud Run

    Jobs - Batch - Vertex Pipeline - その他 - Google Kubernetes Engine - Big Query - Cloud Data Fusion 9
  2. Batch - Cloud Runよりもより長時間で、GPUを使ったタスクも実行できる - 特定のimageまたはscriptをCompute Engine上で動かすことができるようなもの - SSDとかFileStorageをマウントしたVMを指定して動かすということができる -

    spot vmも使えるので金額は抑えやすい - Cloud RunのようにTaskとしてまとまるわけじゃない - jobIdを一意として実行されるので、定期的に同じを jobをやる場合 コンソール上だと命名規則規則などで若干工夫が必要 13
  3. BigQuery - Scheduled Query - 外部リソースを使えるようにして定期的に外部データをテーブルに突っ込むことができる - 単純な集計はこれが一番良さそう - Data

    Transfer Service - AWSのS3のデータなどの外部データを、 BigQueryに突っ込むことができる - データの整合が取れていれば問題なく行けるが、だいたいうまく行かないので、 Dataflowとかを 使うことが多い 17