Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データエンジニアがクラシルでやりたいことの現在地

Avatar for harry harry
July 28, 2025

 データエンジニアがクラシルでやりたいことの現在地

「データエンジニアがクラシルでやりたいこととその理由」というブログを書いてから1年。
今どこまで到達をして、どういうことを考えて、どこに向かっているのかをお話します。
https://note.com/gappy50/n/n24fc4aa963d0

〜事業を支えるデータエンジニアリングとは〜各社のデータ活用の現在地
https://findy.connpass.com/event/363726/

Avatar for harry

harry

July 28, 2025
Tweet

More Decks by harry

Other Decks in Technology

Transcript

  1. 1年前に書いたブログ 「データエンジニアがクラシルでやりたいこととその理由」 ブログで提示した3つのやりたいこと 1. 3900万人規模の1st Partyデータを活用 ・ レシピ閲覧から購買まで全ファネルを分析 2. ゼロからデータ基盤を構築

    ・ データマネジメントチームの立ち上げ 3. 発明力を強くするデータ文化 ・ 全員がデータから価値を生み出す組織へ → 1年後の今、どこまで実現できたか
  2. 浮かび上がってきた3つの課題 1. データのサイロ化 ・ クラシル(Snowflake)とリワード(BigQuery) ・ ユーザーの購買行動全体が見えず機会損失に 2. Redashのクエリが価値を生まない ・

    Redashをforkして、それをforkして、それをforkして… ・ SSoTがなく、正しいデータ探しに時間を浪費し、PDCAが回らない 3. 組織がスケールしない ・ 残念なことにデータエンジニアがボトルネックに ・ 重要なところにのみ投資し、知識も属人化
  3. Redashではデータライフサイクルが回らない ForkのForkのForkでSSoTが崩壊 ・ 元クエリから派生して正解が分からない ・ 1年で1000個以上の無秩序なクエリ 管理統制の限界 ・ 命名規則なし、タグなし、検索不可能 ・

    誰でも変更可能でガバナンス不在 知識の属人化 ・ クエリの意図や計算ロジックがブラックボックス ・ ビジネスコンテキストが引き継がれない → データから価値を生み出すサイクルが停滞
  4. 段階的な導入戦略 データオーナー制度の導入 権限設計とロール定義 ・ データオーナー:各スクラムの意思決定責任者 ・ Developer:SQLを書くメンバー ・ Editor:ダッシュボード作成者 ・

    Viewer:ダッシュボード閲覧者 4ステップの成長パス 1. 定型分析を見る(Spaces/Dashboard活用) 2. ダッシュボードを作る(Query From Tables) 3. 深掘り分析をする(アドホック分析) 4. 高品質なモデルを作る(データエンジニアと協働)
  5. 導入の成果 15名のデータオーナーが誕生 ・ PdMがOBTを自ら実装してSSoTを実現 ・ Bizチームが商談中にダッシュボード活用 ・ データ出し依頼がほぼゼロに データエンジニアはDataOpsに集中 ・

    個別の分析依頼対応から解放 ・ CI/CDパイプライン構築 ・ AIを活用した自動化の推進 → これからデータライフサイクルをいかに高速にまわしていくかが大事
  6. AIを活用したデータライフサイクル Step1: DataOpsの型を作る【現在地】 ・ 高速なアドホック分析を継続 ・ Devin x PlaybookでDataOps自動化を実現 (zenn.dev/dely_jp/articles/ai-dataops-devin-playbook-automation)

    Step2: ライフサイクルを回す ・ 3ヶ月でAdhocデータを削除するルール ・ 定常分析への昇華をAIがサポート ・ コンポーネント化をClaude Codeで支援 Step3: AI Readyなデータ活用 ・ Snowflake Intelligenceとの連携 ・ すべての人がAIエージェントで分析
  7. AIとデータ品質の両立 意思決定者のオーナーシップは崩さない データエンジニアの新しい役割 ・ 可観測性を基盤として担保 ・ テスト実装や異常データの自動検知の仕組み化 いつの間にAI Readyになってる!となる仕組み作り ・

    メタデータやテストを埋めてもらうことでAIエージェントを使えるインセンティブ設計 ・ LightdashのYAMLをSnowflakeのSemantic Modelに自動変換する仕組み ・ AIエージェントのガードレール設計 今後を見据えて ・ MCP(Model Context Protocol)の活用 ・ 画像・テキストデータのパイプライン構築
  8. まとめ ベストプラクティスは存在しない 技術的課題は解決しやすい ・ AIやツールで素早く対応可能 ・ ベストプラクティスも豊富 本当の勝負は適応課題 ・ 組織にどう価値貢献するか

    ・ AIだろうが何だろうが泥臭く向き合う データから価値を生み出すために 技術 < 組織 < 文化 組織の適応課題に向き合い続けることが 「発明力を強くする」 唯一の道