Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Findy Data Engineering Summit 2025/11/06 mybest

Avatar for Jun Naito Jun Naito
November 06, 2025

Findy Data Engineering Summit 2025/11/06 mybest

Data Engineering Summit登壇資料
https://data-engineering-summit.findy-tools.io/2025

▼マイベスト
https://my-best.com/

▼マイベストのデータを嗜む会
https://note.com/njunn/m/mb2de23a25fbc

Avatar for Jun Naito

Jun Naito

November 06, 2025
Tweet

More Decks by Jun Naito

Other Decks in Technology

Transcript

  1. WHY ユーザーの課題 選択は検索で行われているが、ペインが大きい 今のインターネットは信頼できない情報やステマ等の嘘で溢れ、何かを選択するという行動がとても難しいと感じています。 2022年7月アンケート実施 検索に対して不便・不安を感じるか 20代〜60代までの男女 N = 1,000

    博報堂 / Paasons Advisory「買い物における情報収集手段の利用時間シェア」 N=10,000 インターネット検索 60.6% やや感じる 52.5% どちらでもない 16.9% 専門サイト 13.2% 検索に対して 満足していないユーザー 約 73.2% 何かを選択する時に インターネットを利用するユーザー 約 60.6% SNS 7.8% やや感じない 16.6% 家族・友人・知人 7.8% 店舗・営業マン・セミナー 5.8% 全く感じない 10.1% 紙媒体 4.8% 非常に感じる 3.8% 検索を使った選択に対してのアンケート 買い物における情報収集手段の利用時間シェア 7割以上の人が検索に満足できていない 現状の”選択”は検索がメイン
  2. 15 検索 (SEO) ログ ・対策キーワードの順位 ・検索CTR etc. サービスDB ・商品情報 ・順位、検証スコア

    etc. ユーザーログ ・セッション ・クリック、CTR ・読了 etc. コンバージョンログ 主要3EC + ASPそれぞれで ・コンバージョン数、 CVR ・売上 etc. 広告出稿状況 ・Adsense or 企業広告 ・広告収益 etc. その他 ・各種予算 ・社内管理用メタデータ ・関連YouTube動画 etc. マイベストのデータ基盤 1つのコンテンツでも多様なデータが存在する
  3. 未来を見据えた泥臭いデータ戦略の話 事業の未来に備えて目先の分析よりも徹底的にデータ整備を優先 ①探索的分析:何があった? - データレイク‧ELTパイプライン構築 - データ分析基盤の整備、品質強化 - データカタログの導⼊ ②診断的分析:なぜ起こった?

    - 要因分析、因果推論 - 統計モデリング ③予測的分析:次どうなる? - 各種機械学習による予測モデル構築 - MLOps基盤の構築 ④処⽅的分析:何が最適? - リアルタイムデータ連携及び活⽤ - 数理最適化 FY24 FY25 FY26 なぜ起こった? 次どうなる? 何が最適? ☝今のマイベストはこのあたり
  4. 未来を見据えた泥臭いデータ戦略の話 ③メタデータを完全整備 2024年10月 2025年10月 👈 Point① メタデータはDataformのリ ポジトリにすべて集約管理 する方式に移行 👈

    Point② CursorなどのAIツールを活 用し、ドメイン知識を元にし てすべてのメタデータを生成 メタデータ充⾜率はほぼ100%へ メタデータはリポジトリに集約