Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TROCCOとRedshift Serverlessで描くシン・データ基盤
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
masaru-tech
March 16, 2026
0
20
TROCCOとRedshift Serverlessで描くシン・データ基盤
#p_UG 東京:EC×データ基盤の試行錯誤を語る会 ~みんなの工夫とTROCCO活用術~ のLT資料
masaru-tech
March 16, 2026
Tweet
Share
More Decks by masaru-tech
See All by masaru-tech
Sidekiqでクラスターモードは使えるのか? / kawasakirb_060
masarutech
0
830
stimulusの感触
masarutech
0
49
kawasakirb053
masarutech
0
5.6k
「はやい、やすい、うまい?」React Native
masarutech
1
640
Featured
See All Featured
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
480
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.4k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
320
Utilizing Notion as your number one productivity tool
mfonobong
4
260
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
250
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.7k
Speed Design
sergeychernyshev
33
1.6k
We Have a Design System, Now What?
morganepeng
55
8k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
110
Believing is Seeing
oripsolob
1
83
Context Engineering - Making Every Token Count
addyosmani
9
750
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
210
Transcript
TROCCOとRedshift Serverlessで描くシン・データ基盤 #p_UG 東京:EC×データ基盤の試行錯誤を語る会 ~みんなの工夫とTROCCO活用術~
大庭 将(おおば まさる) レンティオ株式会社(2020/07〜) 開発部所属データチーム所属(2026/03〜) <- New!! 最近の趣味は、筋トレ(2023-)/ピアノ(2025-)/日本酒 自己紹介
レンティオとは https://speakerdeck.com/rentio/company-profile-for-engineers
目次 1. 旧データ基盤と課題 2. シン・データ基盤 3. シン・データ基盤でのTROCCOの役割 4. シン・データ基盤の感触 5.
今後の展望
旧データ基盤と課題
旧データ基盤
Railsによる実装なのでエンジニアしか保守できない データ増加にともなう実行時間の増加 全件洗替 失敗すると業務中での復旧が難しくなってきた 少ない人数でEmbulkやデータ基盤のお世話するのに手間がかかる 旧データ基盤の課題
シン・データ基盤
シン・データ基盤
正直そこまで強い思いがあるわけではない Webアプリ基盤などほとんどがAWS内にある レンティオの本番環境をAWS Copilot/Fargate構成に切り替えた話 - Zenn BigQueryは確かにすごい(語彙力) でもRedshiftはそこまで劣るのか わざわざAWS外に出す労力、コストに見合ってるのか Redshift
Serverlessの登場 クラスターやノード管理などの運用コストがかかりそうなプロビジョニング タイプしかなかったらおそらくRedshiftに決めていない なぜRedshift Serverless?
シン・データ基盤でのTROCCOの役割
各サービスからRedshiftへ sourceテーブルへデータを集約。豊富なコネクタにより簡単に集約可能になった TROCCOの役割①
dbtの実行環境 dbt cloudの利用も考えていたが別にするよりTROCCOに乗っかって依存を増やさないようにした TROCCOの役割②
BigQueryへのデータ転送 BigQueryを参照しているLookerStudioやRedashのために残っていて、現在ここをなくすべく今頑張ってい るところ TROCCOの役割③
シン・データ基盤の感触
豊富なコネクタによる利用ケースの拡大 利用コネクタ数: 3(2022/10)->14(2026/03) エンジニアしか設定できなかったものがデータチームなどの他のメンバーも使え るように エンジニア以外が作成した転送ジョブは全体の約60% とはいえ初めての接続先とかだと初期設定のお膳立てはまだ必要 ワークフロー機能により処理順序と依存関係が明確に この時間くらいまでには転送Aが終わってるからその30分後に処理Bを起動す るスケジュールにしておいて...みたいなことをやらなくてよくなった
TROCCOはイイゾ〜
※ まだ既存のクエリやダッシュボードを移行中でヘビーに使えてるわけではないという前置きをしつつ 現状クエリ速度の不満は出ていない Max capacityを48 RPUsに制限している状態 Serverlessなのでコールドスタート時の遅さは感じるが許容範囲内 コスト管理のしやすさ RPUという消費したコンピュータリソースでの従量課金(+ストレージ料金) BigQueryはデータスキャン量での従量課金
インフラ運用の手間がない RPUの制限とクエリのタイムアウト設定をするくらいしかしてない Aurora(Federated Query)やS3(Spectrum)の参照が簡単 BigQueryでのスプレッドシートの参照も便利だったが インフラ管理も既存のCDKに一元化できた Redshift Serverlessはイイかも〜
今後の展望
もっと気軽に誰でもTROCCOを使ってもらいたい データが必要な人がやれるとやり取りをするコミュニケーションコストがな くなる とはいえ非エンジニアにはとっつきにくい TROCCOのTerraform Providerを構成管理のためでなくClaude CodeなどのAIと 組み合わせた転送設定のv0版作成みたいな使い方はどうかと最近考えている 人にもAIにも使いやすいデータ分析基盤へ データ管理体制の整備
まだ全然イメージできてないのでDMBOKや他社の取り組みを参考に解像度を 高めていくところから などなど 今後の展望
ご清聴ありがとうございました
新しい 消費行動をつくる 私たちは、あらゆる製品を買わずに試せる 新しい消費の仕組みをつくっています。