Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TROCCOとRedshift Serverlessで描くシン・データ基盤
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
masaru-tech
March 16, 2026
93
0
Share
TROCCOとRedshift Serverlessで描くシン・データ基盤
#p_UG 東京:EC×データ基盤の試行錯誤を語る会 ~みんなの工夫とTROCCO活用術~ のLT資料
masaru-tech
March 16, 2026
More Decks by masaru-tech
See All by masaru-tech
Sidekiqでクラスターモードは使えるのか? / kawasakirb_060
masarutech
0
840
stimulusの感触
masarutech
0
49
kawasakirb053
masarutech
0
5.6k
「はやい、やすい、うまい?」React Native
masarutech
1
640
Featured
See All Featured
How to Ace a Technical Interview
jacobian
281
24k
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.8k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
200
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
250
Fireside Chat
paigeccino
42
3.9k
Raft: Consensus for Rubyists
vanstee
141
7.4k
Building Applications with DynamoDB
mza
96
7k
The Limits of Empathy - UXLibs8
cassininazir
1
280
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
110
Agile that works and the tools we love
rasmusluckow
331
21k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
330
Transcript
TROCCOとRedshift Serverlessで描くシン・データ基盤 #p_UG 東京:EC×データ基盤の試行錯誤を語る会 ~みんなの工夫とTROCCO活用術~
大庭 将(おおば まさる) レンティオ株式会社(2020/07〜) 開発部所属データチーム所属(2026/03〜) <- New!! 最近の趣味は、筋トレ(2023-)/ピアノ(2025-)/日本酒 自己紹介
レンティオとは https://speakerdeck.com/rentio/company-profile-for-engineers
目次 1. 旧データ基盤と課題 2. シン・データ基盤 3. シン・データ基盤でのTROCCOの役割 4. シン・データ基盤の感触 5.
今後の展望
旧データ基盤と課題
旧データ基盤
Railsによる実装なのでエンジニアしか保守できない データ増加にともなう実行時間の増加 全件洗替 失敗すると業務中での復旧が難しくなってきた 少ない人数でEmbulkやデータ基盤のお世話するのに手間がかかる 旧データ基盤の課題
シン・データ基盤
シン・データ基盤
正直そこまで強い思いがあるわけではない Webアプリ基盤などほとんどがAWS内にある レンティオの本番環境をAWS Copilot/Fargate構成に切り替えた話 - Zenn BigQueryは確かにすごい(語彙力) でもRedshiftはそこまで劣るのか わざわざAWS外に出す労力、コストに見合ってるのか Redshift
Serverlessの登場 クラスターやノード管理などの運用コストがかかりそうなプロビジョニング タイプしかなかったらおそらくRedshiftに決めていない なぜRedshift Serverless?
シン・データ基盤でのTROCCOの役割
各サービスからRedshiftへ sourceテーブルへデータを集約。豊富なコネクタにより簡単に集約可能になった TROCCOの役割①
dbtの実行環境 dbt cloudの利用も考えていたが別にするよりTROCCOに乗っかって依存を増やさないようにした TROCCOの役割②
BigQueryへのデータ転送 BigQueryを参照しているLookerStudioやRedashのために残っていて、現在ここをなくすべく今頑張ってい るところ TROCCOの役割③
シン・データ基盤の感触
豊富なコネクタによる利用ケースの拡大 利用コネクタ数: 3(2022/10)->14(2026/03) エンジニアしか設定できなかったものがデータチームなどの他のメンバーも使え るように エンジニア以外が作成した転送ジョブは全体の約60% とはいえ初めての接続先とかだと初期設定のお膳立てはまだ必要 ワークフロー機能により処理順序と依存関係が明確に この時間くらいまでには転送Aが終わってるからその30分後に処理Bを起動す るスケジュールにしておいて...みたいなことをやらなくてよくなった
TROCCOはイイゾ〜
※ まだ既存のクエリやダッシュボードを移行中でヘビーに使えてるわけではないという前置きをしつつ 現状クエリ速度の不満は出ていない Max capacityを48 RPUsに制限している状態 Serverlessなのでコールドスタート時の遅さは感じるが許容範囲内 コスト管理のしやすさ RPUという消費したコンピュータリソースでの従量課金(+ストレージ料金) BigQueryはデータスキャン量での従量課金
インフラ運用の手間がない RPUの制限とクエリのタイムアウト設定をするくらいしかしてない Aurora(Federated Query)やS3(Spectrum)の参照が簡単 BigQueryでのスプレッドシートの参照も便利だったが インフラ管理も既存のCDKに一元化できた Redshift Serverlessはイイかも〜
今後の展望
もっと気軽に誰でもTROCCOを使ってもらいたい データが必要な人がやれるとやり取りをするコミュニケーションコストがな くなる とはいえ非エンジニアにはとっつきにくい TROCCOのTerraform Providerを構成管理のためでなくClaude CodeなどのAIと 組み合わせた転送設定のv0版作成みたいな使い方はどうかと最近考えている 人にもAIにも使いやすいデータ分析基盤へ データ管理体制の整備
まだ全然イメージできてないのでDMBOKや他社の取り組みを参考に解像度を 高めていくところから などなど 今後の展望
ご清聴ありがとうございました
新しい 消費行動をつくる 私たちは、あらゆる製品を買わずに試せる 新しい消費の仕組みをつくっています。