Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Agent Ready になるためにデータ基盤チームが今年やること / How We're M...
Search
Hiroka Zaitsu
February 20, 2026
Technology
230
0
Share
Agent Ready になるためにデータ基盤チームが今年やること / How We're Making Our Data Platform Agent-Ready
第6回福岡データエンジニアリング勉強会(居酒屋LT)
https://fukuoka-data-engineering.connpass.com/event/381028/
Hiroka Zaitsu
February 20, 2026
More Decks by Hiroka Zaitsu
See All by Hiroka Zaitsu
AI が Approve する開発フロー / How AI Reviewers Accelerate Our Development
zaimy
1
320
GMOペパボのデータ基盤とデータ活用の現在地 / Current State of GMO Pepabo's Data Infrastructure and Data Utilization
zaimy
3
370
ビジネス職が分析も担う事業部制組織でのデータ活用の仕組みづくり / Enabling Data Analytics in Business-Led Divisional Organizations
zaimy
1
780
Vertex AI Matching Engine と CLIP を使って EC サービスの類似画像検索機能を作る / Development of similar image search function for EC services using Vertex AI Matching Engine and CLIP
zaimy
0
790
BigQuery の日本語データを Dataflow と Vertex AI でトピックモデリング / Topic modeling of Japanese data in BigQuery with Dataflow and Vertex AI
zaimy
1
6.3k
データサイエンティストの仕事紹介 / Data Scientist Job Introduction
zaimy
1
670
GMOペパボのサービスと研究開発を支えるデータ基盤の裏側 / Inside Story of Data Infrastructure Supporting GMO Pepabo's Services and R&D
zaimy
1
1.9k
正則化とロジスティック回帰/machine-learning-lecture-regularization-and-logistic-regression
zaimy
0
9.1k
ECサイトにおける閲覧履歴を用いた購買に繋がる行動の変化検出 / Change Detection in Behavior Followed by Possible Purchase Using Electronic Commerce Site Browsing History
zaimy
1
980
Other Decks in Technology
See All in Technology
Keeping Ruby Running on Cygwin
fd0
0
160
小説執筆のハーネスエンジニアリング
yoshitetsu
0
710
みんなの「データ活用」を支えるストレージ担当から持ち込むAWS活用/コミュニティー設計TIPS 10選~「作れる」より、「続けられる」設計へ~
yoshiki0705
0
250
AndroidアプリとCopilot Studioの統合
nakasho
0
110
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
6
74k
ネットワーク運用を楽にするAWS DevOps Agent活用法!! / 20260421 Masaki Okuda
shift_evolve
PRO
2
210
Rapid Start: Faster Internet Connections, with Ruby's Help
kazuho
2
620
みんなで作るAWS Tips 100連発 (FinOps編)
schwrzktz
1
300
MLOps導入のための組織作りの第一歩
akasan
0
340
明日からドヤれる!超マニアックなAWSセキュリティTips10連発 / 10 Ultra-Niche AWS Security Tips
yuj1osm
0
590
コミュニティ・勉強会を作るのは目的じゃない
ohmori_yusuke
0
220
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.4k
Featured
See All Featured
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.1k
Scaling GitHub
holman
464
140k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
150
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
340
Faster Mobile Websites
deanohume
310
31k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
380
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.5k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Google's AI Overviews - The New Search
badams
0
980
Test your architecture with Archunit
thirion
1
2.2k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8.1k
Odyssey Design
rkendrick25
PRO
2
580
Transcript
Agent Ready になるために データ基盤チームが今年やること 財津大夏 (@zaimy) GMOペパボ株式会社 技術部データ基盤チーム 2026.02.20 第6回福岡データエンジニアリング勉強会
logo
自己紹介 財津 大夏 ZAITSU Hiroka GMOペパボ株式会社 技術部データ基盤チーム シニアエンジニア 自社データ基盤の開発/運用 二児の父, スバルのファン
13サービスの事業会社 Google Cloud と AWS Python と SQL データ分析も少し
2026年はペパボ「Agent Ready」元年 Agent Ready のための三本柱 Toolset: Agent-First な運用の実現 Dataset: 正しい情報の整備
Mindset: AI 前提を率先垂範 特に Dataset を支えるためにデータ基盤は重要 Agent Ready: 技術部が挑むAIエージェント前提の技術基盤づくり https://tech.pepabo.com/2026/02/19/tech-division-agent-ready-2026/ 3
SSoT(信頼できる唯一の情報源)を確立する Dataset を支えるデータ基盤になるために 現状は SSoT ではない ログはログ基盤、システムメトリクスは監視ツール、ナレッジは Wiki 異なる「売上」を示す複数の集計 AI
は暗黙知を持たない 人間とAIが見ている数字が違えば判断が崩れる 統一データマートを全事業部門へ展開する 人間と AI が同じデータを見て判断する環境 4
SSoT な統一データマートを作るための 2 つの取り組み 基盤を Agentic-AI Ready にする 1. dbt
とワークフロー環境を AI 前提にする dbt Cloud Google Cloud Workflows 2. データマートの開発プロセスを AI 前提にする 散逸しているメトリクスを一旦そのまま取り込む ユーザーインターフェースを変えずに AI がリファクタリングしていく 5
アーキテクチャの変化 1. dbt とワークフロー環境を AI 前提にする Before: Google Cloud Composer(Airflow)+
Cosmos 自由度が高いワークフロー フルマネージドではなく運用コストと金銭的コストが高い DAG 実行のオーバーヘッドが大きく開発サイクルが遅くなりがち After: Google Cloud Workflows + dbt Cloud 制約はあるがシンプルなワークフロー定義 フルマネージドで運用コストと金銭的コストが低い 実行のオーバーヘッドがほぼ無いので AI でトライアンドエラーを回しやすい 6
dbt とワークフロー環境を AI 前提にする CI 実行時間の比較 中央値:約17分→約30秒 平均値:約42分→約2.5分 Cloud Composer:
count 622.000000 mean 41.758601 50% 17.591667 Cloud Workflows: count 476.000000 mean 2.497689 50% 0.516667 7
人間の注力するポイントを変える 2. データマートの開発プロセスを AI 前提にする 従来:人間がモデリングを頑張る モデリングのスキルを持つ人とドメイン知識を持つ人が異なる問題 時間的コストが掛かりがちで投資を回収するのが難しい 新しいアプローチ:まず SSoT
を作る 既存の SQL を dbt model としてそのまま基盤に乗せる SSoT(信頼できる唯一の情報源)を確立 ガバナンスの保証、メタデータ付与が可能な状態にする AI がリファクタリングしていく 8
2026年、データ基盤もエージェント時代へ まとめ dbt とワークフロー環境を AI 前提にする Cloud Composer → Cloud
Workflows + dbt Cloud シンプル・高速・AI フレンドリー データマートの開発プロセスを AI 前提にする まず SSoT を作り、リファクタリングは AI の力を借りる ガバナンスの保証、メタデータ付与が可能な状態にする AI の進歩をデータ基盤と組織の競争力に転換する 9