Upgrade to Pro — share decks privately, control downloads, hide ads and more …

RedshiftからDatabricksに引っ越してみたら、 想像以上に良かった話

Avatar for Databricks Japan Databricks Japan
September 30, 2025
11

RedshiftからDatabricksに引っ越してみたら、 想像以上に良かった話

「第2回 Youは何しにDatabricksへ!?」でお話いただいたデータ・ワン様の資料です

Avatar for Databricks Japan

Databricks Japan

September 30, 2025
Tweet

More Decks by Databricks Japan

Transcript

  1. Copyright Data One Corp. All Rights Reserved. 4 データ・ワンがご提供するソリューション全体像 co-buy®

    購買データ活用Web広告 国内最大規模の購買ID 4,200万ID FamilyMartVision 販促CRMソリューション 国内最大級サイネージ dポイント ファミペイポイント ファミマのクーポン 販促キャンペーン企画 など 購買履歴のある広告ID数・2025年6月時点 さらに今後 12,000店舗へ拡大 1 購買データ×ドコモデータで ターゲティングできる 2 豊富なメディアで 配信できる 3 配信レポートだけでなく 店頭購買計測・ID-POS購買者分析ができる ※購買計測は当社とデータ連携している小売事業者が対象です ※一部の媒体は購買計測に対応しておりません 10,400店舗 1 あらゆる層へ 安定したリーチ 2 ワイド3画面& サウンドの効果 3 購買に近い リーセンシー 2週間延べレジ通過数は 最大 5,500万人 (24h) 豊富なデータ連携 全国16,500店 来店客 1,500万/日 会員情報 ID連携 7,000万 購買情報 レシート 会員情報 購買情報 会員情報 2,000 万DL 会員数 1億 アン ケート NEW!! 2025春に拡大 ID-POS分析対応媒体
  2. 5 ANALYTICS 媒体 COST 課金 imp imp単価 リーチ リーチ単価 Click

    CTR CPC 購買数 購買率 購買単価 売上金額 ROI メディアA ¥1,397,821 imp 1,997,622 ¥0.70 188,824 ¥7.40 7,634 4.04% ¥183 16,951 8.98% ¥82.5 ¥2,959,165 211.7% メディアB ¥930,000 imp 782,885 ¥1.19 187,323 ¥4.96 760 0.41% ¥1,224 5,402 2.88% ¥172.2 ¥185,126 19.9% メディアC ¥826,333 imp 661,732 ¥1.25 180,624 ¥4.57 3,608 2.00% ¥229 3,700 2.05% ¥223.3 ¥587,579 71.1% メディアD ¥730,049 imp 199,243 ¥3.66 72,615 ¥10.05 3,525 4.85% ¥207.1 ¥389,721 53.4% 合計 ¥3,884,203 ¥3,641,482 ¥1.07 629,386 ¥6.17 12,002 1.91% ¥324 29,578 4.70% ¥131.3 ¥4,121,591 106.1% Click 購買(14日間) ROI(14日間) COST(税別) imp リーチ Imp/リーチ/クリックといった通常の広告 指標に加え、購買指標/ROIを一覧で集計 媒体/セグメント/クリエイティブの粒度別 で広告の購買への影響を比較可能 媒体、セグメント、 クリエイティブ間の購買効果比較 配信前後のシェア変化 広告接触セグメントと非接触セグメントの 配信前後での購買指標の伸長率を比較 広告接触が購買に寄与したかを可視化 購買者のデモグラ属性や配信前後のシェア 変化、などを可視化 広告接触・非接触による 購買効果比較 非接触者の配信前後購買指標伸長率を 100%とし比較 さまざまな購買計測 広告効果の可視化 購買者像の深堀り 購買計測結果を配信レポートに掲載 広告接触ログの提供を受けられない 媒体の場合は配信群・非配信群で 購買効果を比較します 購買者の属性 リピート購買状況
  3. [移行検討] Databricksでの検証結果 12 • コストを上げずにパフォーマンスを上げる → Redshiftと比較して劇的に速くなった クエリによっては数十倍速い → 時間当たりのコストは半額ほど

    → 並列実行時の処理速度劣化は大きいが、元が速いので許容範囲 影響を小さくしたい場合は追加のwarehouseも利用可 • 利用可能なファイル形式 → Unity Catalogに外部テーブルとして登録することで、 S3に存在するcsvやparquet等のファイルを読める → Lakehouse Federationの利用でMySQLへのクエリ可能
  4. [移行検討] Databricksでの検証結果 13 • ETL方法の移行容易性 → JDBCが利用可能 • Redshiftと相互利用可能 →

    Glue Catalogにテーブル定義、Databricks側でマニュフェストファイルを生成することで RedshiftからDelta Lakeにクエリ可能
  5. 移行手順 - SQL Warehouseのタイプ選択 16 AuroraにクエリするためのLakehouse FederationはClassicでは利用不可 AuroraはPrivate Subnetに存在するため、Serverlessでは接続不可 →

    Auroraへのクエリが必要な場合はProを利用 Pro/ServerlessとClassicの価格は約2倍違うものの、性能は2倍までは変わらない → Auroraへのクエリが不要な場合はClassicを利用 ※上記の機能制約は移行実施当時の情報