Slide 1

Slide 1 text

©2023 10X, Inc. データプロダクトとは何か (ネットスーパー立ち上げ事業を例に) Data Analyst Career Study #3 2023/9/26

Slide 2

Slide 2 text

©2023 10X, Inc. 自己紹介 2 吉田 勇太(@yutatatatata) 株式会社10X/データプロダクトマネージャー 趣味はPodcast(界隈.chat, 白金鉱業.fm) キャリア: 大学院(バイオインフォマティクス・遺伝子解析) ー> ブレインパッド データサイエンティスト(新卒から8年) ー> 現職(6ヶ月目)

Slide 3

Slide 3 text

©2023 10X, Inc. 今日の話 いただいたテーマ - 「データプロダクトマネージャー」をキャリアの選択肢の一つにするきっかけとなる話 - データプロダクトマネージャーの役割。データアナリストやデータエンジニアと何が違うか - 10X社の具体事例 話すこと - 「データプロダクト」とは何か - 10Xのデータプロダクトについて - 「データプロダクトマネージャー」の仕事 - キャリア話ちょっと 話さないこと - データマネジメント/dbt/データ基盤 ← @takimoさんをフォローしてください!!

Slide 4

Slide 4 text

©10X, Inc. All Rights Reserved. 4 お客様アプリ 提供プロダクト AIによる推薦や高精度の検索により数万点の SKUからスムーズに買い物ができる UX 主な機能 • 数万SKUから商品からスムーズにカゴを作成 • キーワード・カテゴリ検索・お気に入り・注文変更・購入履 歴といった基本機能 • 商品の受け取り方法を選択 • 注文状況・配達状況の確認や通知 • Web(オプションにて提供)

Slide 5

Slide 5 text

©10X, Inc. All Rights Reserved. 5 お客様アプリ 提供プロダクト AIによる推薦や高精度の検索により数万点の SKUからスムーズに買い物ができる UX 主な機能 • 数万SKUから商品からスムーズにカゴを作成 • キーワード・カテゴリ検索・お気に入り・注文変更・購入履 歴といった基本機能 • 商品の受け取り方法を選択 • 注文状況・配達状況の確認や通知 • Web(オプションにて提供) UIが天才なので騙されたと思って 使ってみて!!!! (一ファンの声)

Slide 6

Slide 6 text

©2023 10X, Inc. 10Xが支援する小売企業は全国に広がる 6 お近くにお店が あれば是非!

Slide 7

Slide 7 text

©2023 10X, Inc. 10Xのビジネスモデル超概要 - ネットスーパー/ネットドラッグストアの 売上のうちの数%をいただく売上連動モデル - パートナーの売上が増えるほど 10Xも儲かる! - パートナーと10Xの両者のインセンティブが一致している ← 僕が好きなところ - アプリ構築で終わらず、売上を伸ばすための分析や施策立案も行う伴走型ビジネス パートナーの売上 10Xの収益

Slide 8

Slide 8 text

©2023 10X, Inc. 8 introduction データプロダクトとは

Slide 9

Slide 9 text

©2023 10X, Inc. データプロダクト とは? @dpatil former United States Chief Data Scientist 8.2万 follower “a product that facilitates an end goal through the use of data” データの利用によって最終目標を促進するプロダクト 著書『Data Jujitsu: The Art of Turning Data into Product』 (2012年) より “

Slide 10

Slide 10 text

©2023 10X, Inc. 🤔🤔🤔

Slide 11

Slide 11 text

©2023 10X, Inc. データプロダクトは広い概念 https://towardsdatascience.com/data-as-a-product-vs-data-products-what-are-the-differences-b43ddbb0f123 あらゆるデジタル製品や機能が、 ある目的を達成するためにデータを使用 していれば、 「データプロダクト」とみなすことができる。 “

Slide 12

Slide 12 text

©2023 10X, Inc. データを使っているサービスは 全部データプロダクトなのか? 🤔🤔🤔

Slide 13

Slide 13 text

©2023 10X, Inc. https://towardsdatascience.com/designing-data-products-b6b93edf3d23 I would add an important distinction here; the distinction between products that use data to facilitate an end goal and products whose primary objective is to use data to facilitate an end goal. データを使って最終的な目標を達成する製品 と、 データを使って最終的な目標を達成することを 第一の目的とする製品の違いである。 “

Slide 14

Slide 14 text

©2023 10X, Inc. データプロダクトの5つのタイプ https://towardsdatascience.com/designing-data-products-b6b93edf3d23

Slide 15

Slide 15 text

©2023 10X, Inc. データプロダクトの5つのタイプ 人間の 考える コスト 小 大 データプロダクトは広い概念なので具体事例と接し方も多様である データプロダクト 例 データを使って最終的な目標を達成することを 第一の目的とする製品 人間とのインターフェース 生データ 派生データ アルゴリズム 意思決定の支援 意思決定の自動化 データウェアハウス ビジネスの主要KPIを視覚化する 企業ダッシュボード 自動運転 SQL 可視化 Visualization 車 「Data as a Product vs data products. What are the differences?」の内容を図示 , 発表者が一部加筆

Slide 16

Slide 16 text

©2023 10X, Inc. データプロダクトのポジションマップ 「Designing Data Products」の内容を図示 , 発表者が一部加筆 生データ 派生データ アルゴリズム 意思決定の支援 意思決定の自動化 API・ コーディング ダッシュボード・ 可視化 webアプリなど デバイス・ ハードウェア インター フェースの フレンドリー さ 易 難 人間の考えるコスト 小 大 オープンデータ データウェアハウス 企業ダッシュボード レコメンド カーナビなど レコメンド・ カーナビなど DeepL翻訳 ML駆動 検品システム ML駆動 検品システム ML駆動 癌検知画像システム ML駆動 癌検知画像システム 自動運転・ 石油プラントの最適運 転システム

Slide 17

Slide 17 text

©2023 10X, Inc. データプロダクトのポジションマップ 生データ 派生データ アルゴリズム 意思決定の支援 意思決定の自動化 API・ コーディング ダッシュボード・ 可視化 webアプリなど デバイス・ ハードウェア インター フェースの フレンドリー さ 易 難 人間の考えるコスト 小 大 オープンデータ データウェアハウス 企業ダッシュボード レコメンド カーナビなど レコメンド カーナビなど DeepL翻訳 ML駆動 検品システム ML駆動 検品システム ML駆動 癌検知画像システム ML駆動 癌検知画像システム 自動運転 石油プラントの最適運 転システム ソフトウェアビジネス化 AIビジネス化 「Designing Data Products」の内容を図示 , 発表者が一部加筆

Slide 18

Slide 18 text

©2023 10X, Inc. 18 10Xのデータプロダクトとは

Slide 19

Slide 19 text

©2023 10X, Inc. 10Xにおける「データプロダクト」の超概要 データ処理 by パートナー個社データ (input) 売り場データ (output) ユーザー Stailer App (Dart) アプリに載せる ・ ・ ・ A社 基幹データ X社 基幹データ A社 売り場データ X社 売り場データ Data Product (BigQuery with dbt) X社の ネットスーパーアプリ

Slide 20

Slide 20 text

©2023 10X, Inc. 10Xにおける「データプロダクト」の超概要 データ処理 by パートナー個社データ (input) 売り場データ (output) ユーザー Stailer App (Dart) アプリに載せる ・ ・ ・ A社 基幹データ X社 基幹データ A社 売り場データ X社 売り場データ Data Product (BigQuery with dbt) X社の ネットスーパーアプリ ① 商品・在庫数等のデータを受領して

Slide 21

Slide 21 text

©2023 10X, Inc. 10Xにおける「データプロダクト」の超概要 データ処理 by パートナー個社データ (input) 売り場データ (output) ユーザー Stailer App (Dart) アプリに載せる ・ ・ ・ A社 基幹データ X社 基幹データ A社 売り場データ X社 売り場データ Data Product (BigQuery with dbt) X社の ネットスーパーアプリ ① 商品・在庫数等のデータを受領して ② dbtで整理・変形・計算

Slide 22

Slide 22 text

©2023 10X, Inc. 10Xにおける「データプロダクト」の超概要 データ処理 by パートナー個社データ (input) 売り場データ (output) ユーザー Stailer App (Dart) アプリに載せる ・ ・ ・ A社 基幹データ X社 基幹データ A社 売り場データ X社 売り場データ Data Product (BigQuery with dbt) X社の ネットスーパーアプリ ① 商品・在庫数等のデータを受領して ② dbtで整理・変形・計算 ③ 整理された売り場データを出力

Slide 23

Slide 23 text

©2023 10X, Inc. 売り場データ(商品マスタ)とは 23 参考資料: - ネットスーパーの要 !? あなたの知らない「商品マスタ」の世界 - 10Xブログ - 10Xのネットスーパーデータプロダクトとは何か - 界隈.chat 商品カテゴリー セールス種類 商品画像 商品名 金額(税率) 当該店舗の 在庫有無 商品説明文 簡単にいうと、 どの商品が、いつ、どの店舗に、何個在庫があるか を日単位で整理されたデータ郡 これをdbtで全パートナー、全店舗、全商品で、 毎日計算している 1店舗だけで数万種類の商品!

Slide 24

Slide 24 text

©2023 10X, Inc. 10Xにおける「データプロダクト」の超概要 データ処理 by パートナー個社データ (input) 売り場データ (output) ユーザー Stailer App (Dart) アプリに載せる ・ ・ ・ A社 基幹データ X社 基幹データ A社 売り場データ X社 売り場データ Data Product (BigQuery with dbt) X社の ネットスーパーアプリ ① 商品・在庫数等のデータを受領して ② dbtで整理・変形・計算 ③ 整理された売り場データを出力 ④ データをアプリに載せる

Slide 25

Slide 25 text

©2023 10X, Inc. 商品マスタはネット上の「売り場」そのもの ネット 店舗売り場での創意工夫で魅力的な購買体験をお届け 売場業務を再現するために必要なデータ整理を行うこと・柔軟性を持つことが重要 商品マスタ 任意の特集やセールも 実施できるようにする リアル 店舗

Slide 26

Slide 26 text

©2023 10X, Inc. データを使って最終的な目標を 達成することを第一の目的とする製品 商品マスタ 売り場を再現し、 魅力的な購買体験を作る This is Data Product!!! https://towardsdatascience.com/designing-data-products-b6b93edf3d23

Slide 27

Slide 27 text

©2023 10X, Inc. 10Xのデータプロダクトの現在地はたぶんこのへん 生データ 派生データ アルゴリズム 意思決定の支援 意思決定の自動化 API・ コーディング ダッシュボード・ 可視化 webアプリなど デバイス・ ハードウェア インター フェースの フレンドリー さ 易 難 人間の考えるコスト 小 大 オープンデータ データウェアハウス 企業ダッシュボード レコメンド カーナビなど レコメンド・ カーナビ DeepL翻訳 ML駆動 検品システム ML駆動 検品システム ML駆動 癌検知画像システム ML駆動 癌検知画像システム 自動運転・ 石油プラントの最適運 転システム 10Xのデータプロダクト dbtによるスケーラブルな データ処理パイプライン いろいろ頑張り中 「Designing Data Products」の内容を図示 , 発表者が一部加筆

Slide 28

Slide 28 text

©2023 10X, Inc. 商品マスタはネット上の「売り場」そのもの。故に難しい (toB目線) 商品マスタ = 売り場そのもの なので、 現場から細かく指摘が入る。 売上にも直結するためデータ品質が 非常にシビア (toC目線) 商品マスタ情報の多さ = 売り場の充実度 (商品の多さ、欠品具合)となり、 ユーザー体験に大きく影響する。 売り場データ(商品マスタ) to Business to Consumer

Slide 29

Slide 29 text

©2023 10X, Inc. 29 データプロダクトマネージャーとは どんなことをしているか

Slide 30

Slide 30 text

©2023 10X, Inc. 日本でもホットなポジションになりつつある https://herp.careers/v1/digitalsaiyo/1shh22jHR-Sc (2023/9/26時点) デジ庁でも募集中! (民間企業でもまだ募集をあまり見ない)

Slide 31

Slide 31 text

©2023 10X, Inc. データプロダクトマネージャーとは Data Product Manager / データプロダクトマネジャー? - Data Engineering Study Vol.17

Slide 32

Slide 32 text

©2023 10X, Inc. https://logmi.jp/business/articles/329145 データ処理 by パートナー個社データ (input) 売り場データ (output) ユーザー アプリに載せる ・ ・ ・ A社 基幹データ X社 基幹データ A社 売り場データ X社 売り場データ Data Product X社の ネットスーパーアプリ データプロダクトマネージャーとは これを「なんとかする人」

Slide 33

Slide 33 text

©2023 10X, Inc. データ処理 by パートナー個社データ (input) 売り場データ (output) ユーザー アプリに載せる ・ ・ ・ A社 基幹データ X社 基幹データ A社 売り場データ X社 売り場データ Data Product X社の ネットスーパーアプリ 「なんとかしないといけない」大変なこと

Slide 34

Slide 34 text

©2023 10X, Inc. データ処理 by パートナー個社データ (input) 売り場データ (output) ユーザー アプリに載せる ・ ・ ・ A社 基幹データ X社 基幹データ A社 売り場データ X社 売り場データ X社の ネットスーパーアプリ 「なんとかしないといけない」大変なこと① ①処理の共通化が難しい - 自動化と効率化のカナメ、つまりビジネススケールのキモ - しかし想像を超える各社のデータのバラツキ - 「仕様なので出来ません」と「特別に実装します」のせめぎ合い。プラットフォーマーの苦悩。実装コストとビジネ スインパクトの兼ね合い - 技術だけでは突破できない要件にどう落とし所をつけるか

Slide 35

Slide 35 text

©2023 10X, Inc. データ処理 by パートナー個社データ (input) 売り場データ (output) ユーザー アプリに載せる ・ ・ ・ A社 基幹データ X社 基幹データ A社 売り場データ X社 売り場データ X社の ネットスーパーアプリ 「なんとかしないといけない」大変なこと② ②商品マスタのデータ品質 の担保が難しい - データ処理基盤のアウトプット品質がアプリ評価に直結する。データ品質がシビアに問われる。 - 一方、受領データが個社でバラバラ + 個社独自ロジック → データ品質の崩壊脅威 - データプロダクトの頭痛の種。何をクリアしたら「品質が守られている」といえるか? - 膨大なデータに対し”期待挙動”をビジネス的にも厳密に定義できるか?

Slide 36

Slide 36 text

©2023 10X, Inc. データプロダクトの 旅は続くよ どこまでも https://10x.co.jp/recruit/ TASUKETE

Slide 37

Slide 37 text

©2023 10X, Inc. 37 スキルやキャリアの話 おまけ

Slide 38

Slide 38 text

©2023 10X, Inc. 受託分析データサイエンティスト時代のよしだ(テキトーです) ①PM/PdM project/productの全般に責任を持つ。 ②データアナリスト ビジネスとデータを繋ぎ、意思決定に コミットする人 ③データサイエンティスト 統計学などを駆使して分析を行う人 ④データエンジニア データウェアハウス、基盤を作り運用する人 ⑤アナリティクスエンジニア 分析にすぐ使えるデータやその環 境を作成する人 ⑥機械学習エンジニア MLを駆使してプロダクトに 非線形な発展を加える人 ※受託分析なので担当した案件, 個人の能力にも大きく依存。話半分で。 謎の俺々職能チャート(独断と偏見により作成) 前職で使っていたスキル - どの肩書に近いか

Slide 39

Slide 39 text

©2023 10X, Inc. 受託分析データサイエンティスト時代のよしだ(テキトーです) 謎の俺々職能チャート(独断と偏見により作成) ②データアナリスト ビジネスとデータを繋ぎ、意思決定に コミットする人 ③データサイエンティスト 統計学などを駆使して分析を行う人 ④データエンジニア データウェアハウス、基盤を作り運用する人 ⑥機械学習エンジニア MLを駆使してプロダクトに 非線形な発展を加える人 ここのスキルもっと伸ばしたいな (今後ニーズ増えるだろうな しらんけど ) 受託分析時代の最後に感じていたこと 上流データのガバナンス・質が 後続の分析タスクの全てに影響する 「分析PoC以上」を作れなかった 無念さ ①PM/PdM project/productの全般に責任を持つ。 ⑤アナリティクスエンジニア 分析にすぐ使えるデータやその環 境を作成する人

Slide 40

Slide 40 text

©2023 10X, Inc. 10X DPMとして必要だなと感じているスキル ②データアナリスト ビジネスとデータを繋ぎ、意思決定に コミットする人 ③データサイエンティスト 統計学などを駆使して分析を行う人 ④データエンジニア データウェアハウス、基盤を作り運用する人 ⑥機械学習エンジニア MLを駆使してプロダクトに 非線形な発展を加える人 他チームに専門メンバー有り 他チームに専門メンバー有り ①PM/PdM project/productの全般に責任を持つ。 ⑤アナリティクスエンジニア 分析にすぐ使えるデータやその環 境を作成する人 謎の俺々職能チャート(独断と偏見により作成) ※個人の意見です。

Slide 41

Slide 41 text

©2023 10X, Inc. 分析をしてた人が基盤側(エンジニアリング側)に行く大変さ “システム開発” のお作法へのキャッチアップ - git管理・エラー通知・テスト・品質・アジャイル開発・障害対応ど うするか ...等 「作ったデータが負債になる」という怖さ - 良くも悪くも”システム”として動き続ける - 希望通り「PoC以上」をやれているが今度は逆の苦悩が... システムへの問い合わせが多い - 分析してたころの比じゃない - 対応への優先度付け - 開発のペースを保つための組織運営, タスク融通の仕組み ギャップがデカい... いろいろ挑戦中です

Slide 42

Slide 42 text

©2023 10X, Inc. まとめ 10Xの「データプロダクト」とは - inputが各パートナーの基幹データ , outputが各パートナーの売り場データとなるデータ処理 パイプライン(by dbt)のこと - 各社のバラバラなデータに対して共通処理を実現し、処理の自動化 /スケールすることがキモ - データプロダクトの生成物 = 商品マスタ のデータ品質がCからもBからも厳しく問われる 10Xの「データプロダクトマネージャー」とは - データ特化型のPMの一種であり、データプロダクトを ”なんとかする” 人 - データプロダクト特有のデータマネジメントへの理解も必要 - ビジネスとエンジニアリングの両面から総合的に判断することが多い

Slide 43

Slide 43 text

©10X, Inc. All Rights Reserved. XのDMも歓迎!