Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Snowflake World Tour Tokyo 2025 CCCMKホールディングス セ...

Snowflake World Tour Tokyo 2025 CCCMKホールディングス セッション

9/11に開催されたSnowflake主催のSnowflake World Tour Tokyo 2025におけるブレイクアウトセッション登壇資料

Avatar for タロウ

タロウ

October 31, 2025
Tweet

More Decks by タロウ

Other Decks in Technology

Transcript

  1. Copyright © CCC MK HOLDINGS Co.,Ltd. All Rights Reserved. 2025.9.11

    CCCMKホールディングスにおける データ基盤統合とデータマネジメントとAIの取組み Vポイントデータ基盤の進化と 非構造化データを活用したAI-Agentによる業務改革
  2. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    2 自己紹介 CCCMKホールディングス テクノロジー戦略本部 本部長 松井 太郎 CCCMKホールディングス テクノロジー戦略本部 エンジニアリング部 分析基盤グループリーダー 三橋 正浩 CCCMKホールディングス テクノロジー戦略本部 チーフAIエンジニア 三浦 諒一
  3. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    3 担当領域 ・データ基盤のSnowfl ake統合プロジェクト ・AI/データ/ポイント/会員/Web開発のエンジニア責任者 ・Snowfl akeのData SuperHeroes 2025 世界105人のSnowfl akeコミュニティアンバサダー 自己紹介 CCCMKホールディングス テクノロジー戦略本部 本部長 松井 太郎
  4. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    5 Vポイントについて :CCCMKホールディングスの保有するデータ Data Vol. 1 ライフスタイルアンケートの回答情報:年収・既未婚・子どもありなし 等 志向性(ライフスタイル推計値) 衣食住遊働などを中心に多数の項目で実購買履歴からスコアリング 会員基本情報:性別、年齢、生年月日、居住地 等 アクションスポットデータ 購買履歴と住所情報を掛け合わせた、居住地ではない「活動地」の特定・行動分析 生活属性 基本属性 1秒単位のTV視聴データ:地デジ、BSのLIVE・録画視聴 等。視聴者購買分析も可能 マンションデータと連携:賃料平米単価、売買価格、築年数 等 マンション Yahoo! JAPANと連携:インターネット上の行動履歴からの推計データ 等 電話帳 電話帳データと連携:個人事業主(美容院、歯医者…等)などの特定が可能 TV視聴 WEB行動 ※2025年6月時点
  5. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    6 Vポイントについて :データを活用した顧客可視化と一気通貫のマーケティング支援 Solution
  6. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    7 本日お話すること 1. Vポイントデータ基盤について 2. Snowfl akeを中心としたデータマネジメント 3. AIへの取組み
  7. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    8 本日お話すること 1. Vポイントデータ基盤について 2. Snowfl akeを中心としたデータマネジメント 3. AIへの取組み
  8. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    9 基幹用 Exadata 負荷問題で、各DB個別構築し、多重コスト化 配信用 Exadata 分析用2 Synapse 分析用1 Exadata 基幹用 Exadata 分析サ ー ヒ ゙ス 用 Vertica ワークロード増によるDBがパンクし、用途別にDBを分散 アナリストの増加により、クエリ負荷が激増 一部クラウドリフトもワークロード増による高負荷 容量問題で、配信用DBを分離し、サイロ化 オンプレ時代 事業成長により、データ活用基盤がパンク データ基盤の課題(2020年頃) 統計分析 ツール 統計分析 ツール
  9. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    10 基幹用 Exadata 配信用 Exadata 分析用2 Synapse 分析用1 Exadata 基幹用 Exadata 分析サ ー ヒ ゙ス 用 Vertica 統計分析 ツール 統計分析 ツール データ基盤の現在(業務量増加の中で段階的統合) Snowfl akeを中心とした統合データ基盤を実現 次期基盤移行 統合基盤 Snowfl ake 性能2倍以上/コスト半分以下の大幅向上 全てのデータ基盤をSnowfl akeへ統合 アナリスト/データの数倍増も柔軟対応 BI/AIなど多様なワークロードに対応 サイロ化を解消し、統合データ基盤へ ① ② ③ ④ ⑤
  10. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    11 CCCMK分析基盤全体像 Azure(分析基盤) Analytics&Services AI/機械学習基盤 GCP On-premise Azure(2Cサービス) BigQuery 社外分析レポート メディア配信(自社構築) ・ライフスタイル推計 ・AI/機械学習 ・ダッシュボード ・KPI管理 ・アドホック分析 ・統計分析 ・データサイエンス ポイント 基盤 E D I ポイント提携企業 マイクロサービス群 会員基盤 Bronze Siliver (Prepare) Gold (Mart) Gold (Mart) Gold (Mart) Gold (Mart) 仮名加工化 SIliver MLOps Silver (Scoring) 2Cサービス連携 Gold (Mart) DataSharing SFTP Workfl ow Data ingest / Transform Data Catalog Data lineage Consumers クライアント企業 100社~ メディア担当 10名~ 全社員 600名~ アナリスト 100名~ サイエンティスト 20名~ 各提携企業
  11. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    12 本日お話すること 1. Vポイントデータ基盤について 2. Snowfl akeを中心としたデータマネジメント 3. AIへの取組み
  12. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    13 担当領域 ・データ基盤のSnowfl ake統合プロジェクト ・データ基盤の開発 ・データマネジメントの強化 自己紹介 CCCMKホールディングス テクノロジー戦略本部 エンジニアリング部 分析基盤グループリーダー 三橋 正浩
  13. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    14 データマネジメントの重要性 ・データドリブンな意思決定を左右する 整備されたデータがあれば、ファクトに基づく判断ができ、意思決定の迅速化と早期の軌道修正が可能 ・属人化・ブラックボックス化の解消 「この人しかわからない」「スプレッドシートにしかない」状態による知識のサイロ化を防ぎ、持続可能な組織へ ・コスト削減と効率化の実現 同じようなデータ加工や集計が、複数の部署で重複して行われている非効率な状態の解消 標準化され、再利用可能なデータマートを準備することによる、集計工数の削減とウェアハウスコスト抑制 ・AI・機械学習での活用 モデルの精度は「取り扱うデータの質」が大きく影響する Garbage In Garbage Out(ゴミを入力するとゴミが出力される) 信頼できるデータ基盤が必要
  14. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    15 本日お話すること 1.データマート整備 2.メタデータの充実 3.データ連携の内製化 4.データプロダクト化 データマネジメントに関する取り組み
  15. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    16 本日お話すること 1.データマート整備 2.メタデータの充実 3.データ連携の内製化 4.データプロダクト化 データマネジメントに関する取り組み
  16. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    17 データマート整備① 背景と課題 DWH テーブル テーブル テーブル 俺の 最強データマート 俺の最強のデータマート作った! え?作り方?ソース見て! 毎回手動でつくっているよ ・属人化/更新が手動 先祖代々 秘伝データマート このデータマート昔から使ってるよ! 仕様はわからないけど、これを使えば安心と 教えてもらったから。 ・定義が不明/信頼性に欠ける ・仕様がバラバラ/マートが乱立 マートA もちろん 分析のたびに新しいマートを用意してるよ。 だって、その方が正確だから! マートB マートC アナリストA アナリストB アナリストC
  17. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    18 Snowflake データマート整備② 整備と効果 テーブル テーブル ・ ・ ・ ・ 統一仕様 データマート 統一仕様 データマート 共通基盤スキーマ アドホック分析スキーマ ・ ・ ・ ・ エンジニア 5名で運用 データマート データマート データマート データマート アナリスト・サイエンティスト 100名が自由作成 管理領域の明確化とデータマートの責任分担制 共通基盤スキーマ ・エンジニアが管轄し、整備したマートをアナリストが参照 ・ポイント企業ごとのレイアウトを統一したデータモデルに変換 ・メダリオンアーキテクチャの概念に則ったシルバー層の整備 アドホック分析スキーマ ・アナリストが分析用途に応じて自由に作成して良い領域 ・ゴールド層のデータマートの作成とその品質管理を担う ・利用ログを元に3ヵ月利用していないテーブルを削除 データ品質とクエリ速度の向上 より迅速で精度の高い意思決定に貢献
  18. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    19 データマート整備③ 整理と改善の繰り返し ・データマート化への抵抗 →シンプル化による透明性やクエリ速度向上などのメリットを啓蒙 →段階的にクエリの書き換えや統一を行い、組織に定着 ・性能課題 →仮想的にVIEWで実装していたが、複雑なロジックでは速度が悪化 →チューニングもしくは物理テーブル化(それだけ重い処理を毎回実行していた)
  19. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    20 本日お話すること 1.データマート整備 2.メタデータの充実 3.データ連携の内製化 4.データプロダクト化 データマネジメントに関する取り組み
  20. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    21 メタデータの充実① 課題と必要性 メタデータの管理が必要な理由 ・データは存在しているが“誰でも使える状態”にならない ・目的に沿ったデータがどれか分からない ・どれが信頼できるデータか分からない ・データの意味や使い方が口伝になってしまう ・「この項目の意味は?」→毎回誰かに聞く必要がある ・ 担当変更や退職により“ノウハウ”が失われる ・AIが理解出来る情報が揃えられない ・目的に沿ったテーブルの選択が出来ない ・項目の意味の把握や区分値の適切な判断ができない
  21. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    22 メタデータの充実② 取り組み内容 Snowflake データカタログシステム 運用が煩雑で劣化 登録済みテーブル 論理名 コメント 移行 登録なしテーブル 論理名 コメント 追加登録 新規テーブル 論理名 コメント データエンジニア 開発エンジニア 開発時に登録 Snowflake ML Data Agents Models Studio PU 非構造化データ検索 Cortex Search 構造化データ検索 Cortex Analyst Task-Specific SQL Functions LLMs & Embedding Models Fine-Tuned Models Snowflake Cortex AI Cortex Agents PU AI Observability PR データカタログの整備だけでは、AI-Readyな基盤には足りない
  22. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    23 Snowflake メタデータの充実③ AI-Readyを目指すために 統一仕様 データマート (Silver) AIファーストなデータとセマンティックモデルの整備 Cortex Analyst セマンティック モデル セマンティック モデル ・ ・ ・ ・ Copilot 単テーブルに対しては 一定精度のSQLは生成できるようになったが 複雑な区分値は、生成精度が安定しない。 AIにやさしいデータマートが必要。 複数テーブルの相関がわかり、 データの文脈が分かる、 セマンティックモデルの構築が必要。 多様な分析要件に対応するため、 さらに心を込めた整備をがんばります。 BI・レポート用 データマート (Gold) AI用 データマート (Platinum)
  23. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    24 本日お話すること 1.データマート整備 2.メタデータの充実 3.データ連携の内製化 4.データプロダクト化 データマネジメントに関する取り組み
  24. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    25 連携先 データ連携の内製化① 背景と課題 社内 社内・社外 データ連携機能 DWH ベンダー開発 内製開発 個別処理 個別処理 個別処理 ・ ・ ・ ・ 個別処理 Snowflake統合前の状況 ・データ連携の九割がベンダー開発 ・個別実装のため、仕様もバラバラ 連携仕様を統一して 簡易な開発への落とし込みたい!
  25. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    26 データ連携機能 連携先 データ連携の内製化② 内製化の推進 社内・社外 Snowflake ・外部委託を削減し、ほとんどのデータ連携を内製化 →キャッシュアウト大幅削減 ・Data Sharing機能を活用した連携を積極活用 →これが一番簡単 ・長年使っているETLツールのモダン化を検討 →OpenFlow頑張って ベンダー開発 内製開発 個別処理 共通ETL DataSharing
  26. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    27 FileOutput /SFTP 要件定義 設計 開発 中継サーバ構築 連携試験 リリース On Snowflake (Fileless) 要件定義 設 計 開 発 試 験 データ連携開発 90% Off(当社比) 従来の方式 :インタフェース設計・開発・伝送・各種試験・リリース作業 Snowflake :テーブルのシェアのみ 開発期間短縮のみではなく、関わる人も運用業務も 大幅に削減 (管理者作業のみ) CCCグループ内や業務提携先など多様な企業との連携で活用 リ リ ー ス データシェアリングによる圧倒的生産性の向上
  27. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    28 Snowflake Japan Data Drivers Awards グループ内でのデータシェアリング、 業務提携先とのデータシェアリング、 Snowflakeを基盤とした分析サービスの 取引先への提供などを評価いただきました Data Collaboration賞
  28. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    29 Snowflake マーケットプレイスに公開 Market Watch トレンド分析データ(トライアル版 ※実データの10%)
  29. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    30 Snowflake マーケットプレイスに公開 Q:どんな風に活用できるの? A:高精度なレシート解析による商品単位の購入金額リサーチが可能 市場価格の調査や商品のトレンドなど多角的な分析を実現
  30. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    31 本日お話すること 1.データマート整備 2.メタデータの充実 3.データ連携の内製化 4.データプロダクト化 データマネジメントに関する取り組み
  31. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    32 データプロダクト化① 現在の状況 Snowflake サービスA サービスB サービスC アライアンス企業 CCCMK保有データをアライアンス企業へ分析サービスとして提供 Webアプリケーションだと定型的なデータは みれるけど、私達もアドホック分析がしたい。 自分たちのDWHがほしいな お客様の個々の分析環境の需要が高くなってきている 定型的な分析サービスでは様々なニーズに対応出来ない データを“外部に提供できる価値あるプロダクト”として再定義が必要
  32. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    33 データプロダクト化② 今後の取り組みについて Vポイント提携企業や協業企業向けのデータサービスにSnowflakeをさらに活用していきたい お客様に最適な形でサービス化して提供することで データサービスの価値向上を目指していきます データクリーンルーム Ad向けセグメント生成 サービス パートナー向け データ提供機能 ポータブルウェアハウス サブスクリプション型 データサービス Data Clean Room(DCR)を提供し、 プライバシーの保護とデータ活用の高度化を両立 自社ログ・属性・外部データを掛け合わせ、リスト作成 お客様の条件指定で、自動抽出 Snowflake の Data Sharing機能 を使って 「セキュアで高速な共有」も可能 Snowflake Reader Acount(SRA) + Streamlitで DWHと実行環境までを提供する「DWH軒貸しサービス」 Snowflakeを活かした従量課金型データサービスを NativeAppsで提供(Streamlit+CortexAI) CCCMK 加盟企業 CCCMK 提携先 CCCMK DCR 提携先 CCCMK SRA CCCMK Native Apps
  33. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    34 本パートのまとめ データマートの整備により、分析精度・速度の向上 メタデータとセマンティックモデルにより、AI-Readyな基盤を準備 データ連携の効率化により、キャッシュアウト削減 データプロダクト化により、お客様価値を向上 信頼できるデータ基盤は、地道な活動の積み重ね
  34. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    35 本日お話すること 1. Vポイントデータ基盤について 2. Snowfl akeを中心としたデータマネジメント 3. AIへの取組み
  35. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    36 担当領域 ・深層学習を用いた画像解析・言語解析システム開発 ・大規模言語モデルを利用したAI Agent開発 ・ブログや技術コミュニティで情報を発信しています! 自己紹介 CCCMKホールディングス テクノロジー戦略本部 チーフAIエンジニア 三浦 諒一
  36. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    37 AIへの取組み データ基盤の構築と共にAIへの取組みを並行で進めてきました 01 AI開発基盤の構築 V会員のライフスタイルを分析し、数百項目に渡る予測 データを元にライフスタイルに応じた様々なキャン ペーンやサービスの提供に活用 03 AIサービスの開発 社内Chat-GPTはもちろん、Azure Open AIや Snowflakeなどの各AI開発機能を活用し、 業務特化型のAIエージェントを開発し、社内リリース ・販促時にセグメント提案を行うエージェント ・CSの高度な問合せのサポートエージェント ..etc 02 AI推進室の立ち上げ CCCグループ全体でのAIの活用方針やAI大志を掲げ、 テクノロジー、AIエンジニアリング、法務、コンプラ イアンス、業務部門などの専門家を中心に適切な活用 の推進、社内への啓発活動を実施 04 AI-Readyな基盤の促進 従来、データ基盤のミッションの一つであった、デー タカタログやメダリオンアーキテクチャの整備等は、 AI時代においてさらに重要度が上がっています AI向けのGOLD層の整備やより文脈を持つデータカタ ログや社内の非構造化データの整備も並行して着手
  37. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    38 データ基盤を直接利用することが少ない、営業やオペレータでも SnowflakeのAIを通じて簡単に利用できるようにする AIによるデータ基盤の開放 Cortex Analyst Cortex Search セマン ティック モデル DWH メタデータ AI 質問 質問 質問 回答 回答 回答 営業/ オペレータ アナリスト
  38. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    39 マルチエージェント構成 階層構造を持つマルチエージェントシステムを構築 Table Semantic Model Supervisor Agent Index Cortex Search Expert Agent Table Agent Document Agent Writer Agent Cortex Analyst
  39. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    40 CSの高度な問合せのサポートエージェント お客様との過去のやり取りや現在実施中のキャンペーン情報を元に カスタマーサポートのオペレーターのお問い合わせメールの自動作成を支援
  40. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    41 販促時にセグメント提案を行うエージェント 対象の顧客セグメントの分析を支援し、 レポート作成の支援を行うアプリケーションを開発
  41. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    42 マルチエージェント構成 Supervisor Agentがユーザーの質問を解くために最適なExpert Agentを決定 Table Semantic Model Supervisor Agent Index Cortex Search Expert Agent Table Agent Document Agent Writer Agent Cortex Analyst
  42. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    43 マルチエージェント構成 タスクを分割し専門家であるExpert Agentにサブタスクを実行させる Table Semantic Model Supervisor Agent Index Cortex Search Expert Agent Table Agent Document Agent Writer Agent Cortex Analyst
  43. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    44 マルチエージェント構成 Table Semantic Model Supervisor Agent Index Cortex Search Expert Agent Table Agent Document Agent Writer Agent Cortex Analyst Table AgentはCortex Analystを使用してSQLクエリを生成し、クエリを実行
  44. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    45 マルチエージェント構成 Table Semantic Model Supervisor Agent Index Cortex Search Expert Agent Table Agent Writer Agent Cortex Analyst Document Agent Document AgentはCortex Searchを使用して 質問文に類似した意味を持つ情報を検索するタスクを担当
  45. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    46 マルチエージェント構成 Table Semantic Model Supervisor Agent Index Cortex Search Expert Agent Table Agent Document Agent Writer Agent Cortex Analyst 最後にWriter Agentが他のAgentによって収集されたデータを用いて ユーザーの質問に対する適切な回答を生成
  46. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    47 【精度向上の取り組み】セマンティックモデルの開発 エンジニアとアナリストが協力し、セマンティックモデルの開発に 分析視点の知見を取り入れることで生成されるSQLクエリの品質を向上 セマンティックモデル ( ymlファイル ) エンジニア / アナリスト カラムの説明を明記 特に自社固有定義の用語や表現 (UU=ユニークユーザーなど) Point 1 ユーザーやケースによって 呼び方が変わる項目に 別名を設定 (ユーザー, 会員など) Point 2 合計金額など重要な定義は計算式を明記 (合計金額は税抜き計算に統一するなど) Point 3
  47. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    48 【効率化への取り組み】Search Serviceへのドキュメント取り込み 先日リリースされた日本語もOKなAI_PARSE_DOCUMENTなどの SnowflakeのAI関数を活用し、ドキュメントの読み込みから加工処理まで Snowflakeで完結できるようにしたい。 Computing Cluster - テキスト化 (OCRなど) - チャンク化 Snowflakeとは別の環境で テキスト化やチャンク化を実行 AI_PARSE_DOCUMENT ファイルの読み込みから加工処理までを Snowflake内で完結できるようにしたい! File File
  48. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    49 AIに関する様々な社外発信を強化 テックブログや技術コミュニティサイト等でノウハウや実践例をシェアしてます!
  49. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    50 AIの取り組みのまとめ データ基盤の統合・メタデータの整備・適切なアクセス制御により AIが安全に一元的にデータへアクセス出来るようになった Snowfl akeの高度なAI機能によって、AIを通じて、 誰もがデータを利活用できる環境が整いつつある 構造化データ以外の画像やドキュメントなどもSnowfl akeを通じて、 全てのビジネス情報をAIで活用できる世界を目指したい!
  50. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    51 本日のまとめ 分散していたデータ基盤を段階的にSnowfl akeへ統合 ユーザー増/データ増が続くなか、性能向上とコストダウンを実現 DBの統合と並行して開発の内製化やデータマネジメントを推進し、 利用しやすいデータ基盤が出来上がってきた それらの取組みを進め、データ×AIサービスにより、 V会員や顧客企業へのさらなる価値提供を目指していきます
  51. Copyright - © CCC MK HOLDINGS Co.,Ltd. all rights reserved

    52 まとめ ご清聴ありがとうございました