Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Redshiftを中心としたAWSでのデータ基盤

 Redshiftを中心としたAWSでのデータ基盤

ikeda-masashi

January 30, 2025
Tweet

More Decks by ikeda-masashi

Other Decks in Technology

Transcript

  1. Kayac. Inc @mashiike 面白法人カヤック 管理本部 グループ情報部 所属 自己紹介 Roles: •

    データエンジニア • バックエンドエンジニア • データアナリスト • SRE その他: • 2016年12月にカヤックに 新卒入 • ゲーム好き 最近はPoE2をやってます • 利き茶・利き酒もやります (なお正答率は低い) Redshift/BigQuery/Snowflake、全部使える3刀流 業務・趣味含めて主要なDWHはある程度使います
  2. Kayac. Inc 僕の考える『最強』とは。 背景1:『専任』が居ない。開発チームもデータエンジニアリングする。 補足: カヤックでは、Enabling DRE(Data Reliability Engineering) 的な感じで関わろうとしています。

    各プロダクトの開発チームにデータ(信頼性)エンジニアリングを浸透させて、 開発チーム自体で、データ基盤の開発・保守・運用ができるようにという感じ。 そういう意味でも「専任」というのが薄い。 データエンジニアと名乗ってなくてもデータエンジニアリングはする。 https://www.kayac.com/service/closed_and_soldout また、カヤックは事業売却・撤退が非常に多い。 やってるサービスも幅広い。 なので、統一データ基盤を作るより、 各プロダクト毎にデータ基盤を用意するほうが理にかなってる。 そういう意味でも、Enablingで関わるのがいい
  3. Kayac. Inc AWSにおけるデータ基盤の話 https://aws.amazon.com/jp/events/summits/online/japan/sessions/ AWS Summit 2021 AWS-06: 『貯めるだけじゃもったいない!AWS 分析サービスを使ったデータレイクの有効活用』資料より参照

    基本的には Amazon S3が中心 AWSのほとんどのサービスはS3と の連携を重視する事が多いので、 S3を中心にするのが無難ではある これが、2023年までの話。
  4. Kayac. Inc Q: なんで、dbt Core を ECSで動かしてるん? 謎のカヤック文脈: OSS >

    SaaS の技術選択になりがち。 「いざというときに、ソースコードを読めるので安心!」(エッ A: アプリケーションエンジニアの管理主体に乗っかってるので、  dbt Cloud という SaaSを使うより、dbt CoreというOSSのほうが何 故か、親和性が高かったから。