Upgrade to Pro — share decks privately, control downloads, hide ads and more …

GCPでのバッチ処理パターンを考えてみる

SatohJohn
December 15, 2022

 GCPでのバッチ処理パターンを考えてみる

SatohJohn

December 15, 2022
Tweet

More Decks by SatohJohn

Other Decks in Programming

Transcript

  1. 使えそうなGCPサービスの例 - Cloud Schedulerを使う - Cloud Functions - Cloud Run

    Jobs - Batch - Vertex Pipeline - その他 - Google Kubernetes Engine - Big Query - Cloud Data Fusion 9
  2. Batch - Cloud Runよりもより長時間で、GPUを使ったタスクも実行できる - 特定のimageまたはscriptをCompute Engine上で動かすことができるようなもの - SSDとかFileStorageをマウントしたVMを指定して動かすということができる -

    spot vmも使えるので金額は抑えやすい - Cloud RunのようにTaskとしてまとまるわけじゃない - jobIdを一意として実行されるので、定期的に同じを jobをやる場合 コンソール上だと命名規則規則などで若干工夫が必要 13
  3. BigQuery - Scheduled Query - 外部リソースを使えるようにして定期的に外部データをテーブルに突っ込むことができる - 単純な集計はこれが一番良さそう - Data

    Transfer Service - AWSのS3のデータなどの外部データを、 BigQueryに突っ込むことができる - データの整合が取れていれば問題なく行けるが、だいたいうまく行かないので、 Dataflowとかを 使うことが多い 17