Upgrade to Pro — share decks privately, control downloads, hide ads and more …

経営学部のためのSaaSとサブスクリプションのデータ分析入門

Ryo YOSHI
October 20, 2023

 経営学部のためのSaaSとサブスクリプションのデータ分析入門

経営学部の学生向けのセミナー講義の内容を一部削除・加筆・修正したスライド資料です。
誤植・間違い等ありましたら、SNSにご連絡ください。

Ryo YOSHI

October 20, 2023
Tweet

More Decks by Ryo YOSHI

Other Decks in Business

Transcript

  1. 自己紹介 吉住 遼 @well_living_ry 株式会社マネーフォワード データ戦略室 分析推進部 兼 マネーフォワードホーム株式会社 DataForward室

    SNS等 • note: Ryo YOSHI ( https://note.com/well_living_ry ) • zenn: Ryo YOSHI@welliving • X(旧Twitter): Ryo YOSHI@well_living_ry ↑作画:@akiraturuさん *本資料は神戸大学経営学部の学生向け講義の内容を一部削除・加筆・修正したものです。  2023: https://b.kobe-u.ac.jp/25290/  2024: https://b.kobe-u.ac.jp/31574/
  2. 注釈 • 本資料は神戸大学経営学部の学生向け講義の内容を一部削除・加筆・修正したものです。 ◦ https://b.kobe-u.ac.jp/31574/ • 本資料に記載された情報は登壇者にて判断した情報源を元に個人が作成したものであり、マネーフォ ワードが作成したものではありません。 • 本資料に記載されている会社名および商品・製品・サービス名(ロゴマーク等を含む)は、各社または各

    権利者の商標または登録商標です。 • 本資料に記載された内容は、資料作成時点においてのものであり、予告なく変更する場合があります。 • 本資料の内容および情報の正確性、完全性等について、何ら保証を行っておらず、また、いかなる責 任を持つものではありません。
  3. コンテンツ 1. SaaSとサブスクリプションのビジネス 2. SaaSの管理会計と経営データ分析 3. マーケティングと営業のデータ分析 4. 事業戦略・事業計画と企業データ 5.

    分析に必要なデータ整備とデータマネジメント 6. (2023/10 時点のおまけ)ビジネスでのAI活用とDX・イノベーション 7. 経営データ分析をはじめる方へ〜経営データ /AI人材のキャリア〜
  4. SaaS (Software as a Service)とサブスクリプション SaaS(サース)は、Software as a Service(サービスとしてのソフトウェア )の略

    • PCやオンプレミス(自社保有システム)にソフトウェアをインストールするのではなく、クラウドサーバー上に あるソフトウェアをインターネットを経由してサービスとして提供(下に SaaSの例) • 定期購入 (サブスクリプション : サブスクと略される )の支払い方法が多い 個人向け家計簿のSaaS 企業向け会計等バックオフィスの SaaS SaaSの例 *マネーフォワード 2024/10/15時点Webサイトより 7
  5. Q. 思い浮かぶサブスクは? 広がるサブスク・・・ toBのサブスク 会社名および商品・製品・サービス名(ロゴマーク等を含む)は、各社または各権利者の商標または登録商標です。 音楽 動画 コミック ゲーム ショッピング

    ニュース 学習 CRM 会計 リアル(ネットサービス以外) にも広がるサブスク AI 旧来からある 定期購入サービス 新聞 携帯 通信 表計算ソフト 服 弁当 香水 電気 自転車 家計簿
  6. サブスクリプションのメリット 利用者(または利用企業)にとってのサブスクリプションのメリット • 所有をしなくてよい ◦ (特に企業の場合)固定資産ではないため、メンテナンスコストが少なく、管理が楽 • 不確実性に対応しやすい ◦ (特に企業の場合)社員の増減などにも対応しやすい

    • 意思決定の負担を軽減される ◦ (特に個人の場合)先に支払って、あとで消費すると、期待する喜びと消費する楽しみが増す(エ リザベス・ダン『「幸せをお金で買う」5つの授業』) SaaS企業(またはサブスクを展開する企業 )にとってサブスクリプションのメリット • 定期的に安定した売上が得られる ◦ ゆえに、売上の予測もしやすい • 継続的な顧客接点があるため、 データが集まりやすい
  7. 財務会計と管理会計 • 財務会計・・・企業外部の利害関係者 (ステークホルダー)に企業の財政状態と経営成績を開示・報告す るための会計 ◦ 下図で簡単に説明 • 管理会計 ・・・経営者等の企業マネジメント・

    意思決定 に必要な情報提供を行うための会計 ◦ 過去の実績から未来の予算を策定するための「予算管理」、予算と実績を比較し、経営上の問題を洗い出す「予実 管理」、経営状況を数値で表し、企業の状態を客観的に判断する「経営分析」等 ◦ 次スライド以降で指標を説明 財務会計 資 産 純 資 産 負 債 現 預 金 貸借対照表 営業利益 売上 営業費用 売上原価 販管費 営業外損益 特別損益 法人税等 当期純利益 *参考  https://biz.moneyforward.com/accounting/basic/89/ 営業CF 投資CF 財務CF フリーCF 現預金増減 損益計算書 キャッシュフロー計算書 配当
  8. 分析(Analytics)とは、 分析 = Analytics 支出 細かすぎると比 較して解釈しに くい 集約しすぎると 要因が分かりにく

    い ギリシア語で「分解する」が語源 「分ける」と何が「分かる」のか 家計簿の例 米 飲食チェー ンA 〇〇社 携帯電話 マネーフォ ワード ME △△電力 電気代 分ける 集約する 15万円 様々な支出 500円 5000円 1万円 2000円 2500円 あれ?今月も赤字・・・
  9. 分析(Analytics)とは、 分析 = Analytics 支出 細かすぎると比 較して解釈しに くい 集約しすぎると 要因が分かりにく

    い ギリシア語で「分解する」が語源 「分ける」と何が「分かる」のか 家計簿の例 米 飲食チェー ンA 〇〇社 携帯電話 マネーフォ ワード ME △△電力 電気代 食費 通信費 水道光熱費 分ける 集約する 適切な粒度で分ける • 前月と比べて食費が増えてい る。。。外食しすぎた • 毎月の食費を5万円以内に抑え たいけど、今月は6万円使ってし まっている。。。 • 普通の一人暮らしだと食費はだ いたいどのくらいだろう? 15万円 6万円 2万円 1万円 分けると比較がし やすくなる
  10. 「分ける」と何が「分かる」のか 過去と比べる ・先月と比べる ・前年同月と比べる 理想・目標 と比べる 他者(他社) と比べる 何と比較する? データを記録する

    必要がある 目標を立てる必要が ある 調査する必要がある • 前月と比べて食費が増えている →過去との比較 • 毎月の食費を5万円以内に抑えたいけど、今月は 6万円使ってしまっている →目標との比較 • 普通の一人暮らしだと食費はだいたいどのくらいだろう? →他者との比較 →* 目的によって比較に適切な粒度も異なる • 分けると比較がしやすくなる
  11. 比較することで何ができるようになるのか • 比較することで選択(意思決定) がしやすくなる ◦ 前月と比べて食費が増えているから、来月は外食を減らそう、という選択ができる ◦ 前月は1万円予算をオーバーしたから、来月と再来月は毎月の予算より 5000円ずつ節約しよう、 という選択ができる

    ◦ 一人暮らしの食費の平均は 4万円ちょっとらしい。食べることは好きだけど、予算を毎月 5万じゃな くてまずは4万5千円にしよう、そもそもお米はネットより〇〇スーパーの△△米が安いからそっち に変えよう、という選択ができる • 選択(意思決定)はやるべき行動につながり、行動からは価値が生まれる ◦ お金を貯めるにも、本当にやりたいことにお金を使って人生を楽しむにも、日々の選択が大事 ◦ ビジネスも同じで、選択からユーザーへの提供価値や企業の利益が生まれる 管理会計では、経営者の 選択(意思決定) のためにデータを「分析」する 20
  12. 一般的な売上の分解 売上 金融機関 向け 法人向け 個人向け 事業組織で分解する 売上 クラウド 確定申告

    クラウド 会計 クラウド 給与 プロダクトで分解する 日本 インド ネシア エリアで分解する 売上 販売数 単価 ロジックツリーで分解する 売上 • マネーフォワードにおいてもこれらの分け方を使っています。 • 加えて、SaaS(サブスク)特有の分け方もあります。
  13. ARRとMRR(経常収益) • Annual Recurring Revenue(ARR)・・・年間経常収益 • Monthly Recurring Revenue(MRR)・・・月次経常収益 経常収益

    非経常 収益 定期性で分解する 売上 繰り返し発生する定期的・継続的な収益 ARR = 前期ARR + ACV − Churn • ACV・・・年間契約金額(Annual Contract Value) ◦ 月次の場合、新規ユーザーの MRRをNewMRRという • Churn・・・解約ユーザーから得られるはずだった収益 ◦ ここではレベニューチャーン (チャーンの定義は後述) さらに分解 • SaaS(サブスク)ビジネスでは、新規獲得とリテンション (解約の抑 制)が重要指標になることが、売上の分解で見えてくる 前 期 A R R A C V 解 約 A R R
  14. 【補足】チャーン チャーンとは • チャーン(Churn)は日本語で解約 • サブスクリプションビジネスでは、チャーンを抑制することが売上において非常に重要 様々なチャーンの定義 • カスタマーチャーン :一定期間中に失ったユーザー数

    ◦ =期間解約ユーザー数 /期初ユーザー数 • レベニューチャーン :一定期間中に失った売上額 ◦ =解約ユーザーの経常収益 /経常収益合計(*分母・分子の計算定義は ) • アクティビティチャーン:解約リスクがあるとされるユーザー数で、計算方法はプロダクトごとに異なる 1. プロダクトのエンゲージメントを定義 2. プロダクト・アクティビティ(イベント等)をトラッキング 3. 各イベントを重み付け 4. スコアを標準化し、意味付け 5. スコアを実行可能なアクションに落とし込み
  15. ARPAと課金ユーザー数 • Average Revenue Per Account(ARPA)・・・アカウントあたり平均収益。アーパと読む • Average Revenue Per

    User(ARPU)・・・ユーザーあたり平均収益。アープと読む • Average Revenue Per Paid User(ARPPU)・・・課金ユーザーあたり平均収益。アープと読む *UserだけでPaid Userを表すケースやAccountとUserが同義で使われるケースもある 販売数 単価 一般的な売上の分解 売上 SaaSの場合 課金 ユーザー数 ARPA 経常収益の分解 経常収益 *ARPA=ARPPUの場合 モノであれば、例えば、書 籍が何冊売れたか等 • 売上を分解することで、前年や他社と比べて、 ARPAが高 いか・低いか等、比較することができる
  16. NPV(正味現在価値)とIRR(内部収益率) • NPV(Net Present Value)・・・正味現在価値 ◦ NPV>0が良いとされる ◦ 割引率 r

    は、資金調達の利払い等に伴う資本コストや、将来のキャッシュフローのリスクや期待リ ターン、他の投資機会から得られた機会費用などを考慮して算出される • IRR(Internal Rate of Return)・・・内部収益率 ◦ 割引率が事前に分かってなくても計算できる ◦ IRR>1が良いとされる ◦ 手計算は難しいがExcelやプログラミング言語 Pythonで簡単に計算できる *分かりやすく、初期投資と以降の  収益を分け、CF>0とした場合
  17. 顧客一人あたりの価値(売上・利益)をどう評価する? • 販売数(→モノ・商品)よりも、ユーザー数( →ヒト・顧客)に向き合うことがより重要 販売数 単価 一般的な売上の分解 売上 SaaSの場合 課金

    ユーザー数 平均収益 経常収益の分解 経常収益 ユーザー Aさん ユーザー Bさん 顧客ごとのキャッシュ・フロー 解 約 プラン 変更 顧客一人あたりの平均的な売 上キャッシュ・フローの価値を どう評価する? 1年目 2年目 8年目 ・・・・・
  18. CAC Payback PeriodとLTV SaaSの管理会計では、顧客一人あたりの価値も重要な指標 • Customer Acquisition Cost(CAC)・・・顧客獲得コスト • CAC

    Payback Period・・・CACに関する投資回収期間 • Customer LifeTime Value(LTV, CLV, CLTVなど略し方が複数)・・・顧客生涯価値 ◦ 一人あたりの顧客から得られる売上の現在価値 ◦ CACを含めてLTVとする定義もあります  顧客解約率(Customer Churn Rate)をCCR、平均収益ARPA(≒ARPPUと同義)とすると、 *割引率r=0の場合 高校数学の等比級数の和 例:あるアプリの月額プランは月 500円。割引や他のプランへの変更がないとすると平均収益 ARRAも500 円。仮に月次解約率 2%のとき、LTVは25000円。 30
  19. 【補足】LTV計算の前提 よく使われるLTVの近似は案外強い仮定が多い • 割引率ゼロ→普通ない • 解約率一定→普通ない • 最終時点が無限大→普通ない • 課金額一定→あまりない

    例:ARPA500円、月次解約率2%のとき、LTV25000円。r=2%だと24500円。120ヶ月だと22787円、解約率 が0.5%高いと2万円。よくある近似はだいたい LTVを高く見積もる。分母が小さいときは数字がブレやすいの で要注意(解約率は数字が小さくブレやすい ) *割引率r=0の場合 高校数学の等比級数の和 計算の前提を理解した上で、指標を活用することが大切 32
  20. ユニット・エコノミクス〜費用対効果〜 SaaSの管理会計では、顧客一人あたりの価値も重要な指標 • LTV(顧客生涯価値)・・・単純化した定義は ARPAを顧客解約率で割ったもの(詳細は前ページ) • Average duration・・・平均継続期間 • ユニット・エコノミクス・・・

    LTVをCACで割ったもの。3より大きいと良いとされる ◦ 平均継続期間をCAC Payback Periodで割ったものに式変形される  Customer Churn Rate (顧客解約率)をCCR、ユニット・エコノミクスを UE、CAC Payback PeriodをPP、 Average duration(平均継続期間)ADとする。 例:ユニット・エコノミクスが 3より大きいとは、例えば、月次解約率 2%のときCAC Payback Periodが16.7ヶ月 よりも小さいと良いという意味になり、 CAC Payback Periodが12ヶ月のとき月次解約率が 2.78%より小さいと 良いという意味になる
  21. 【補足】デュレーション • Average duration(デュレーション)・・・平均継続期間 • ファイナンスでは債券の投資回収期間の計算にも用いられる概念 • デュレーションは解約率変化に対する LTV変動率でもある 期間t

    ユーザー数Nt t=1 N(1-CCR)・CCR t=2 N(1-CCR)^2・CCR t=T N(1-CCR)^T・CCR *計算の詳細はスライド形式は不向きなため、近々zennで説明  https://zenn.dev/welliving/articles/c17c30071e5d7b
  22. 【補足】数式の変形 • 「顧客生涯価値LTV、解約率、CAC PaybackPeriod、デュレーション、ユニット・エコノミクスの計算」を zennで説明しています。 ◦ https://note.com/well_living_ry/n/nd4848a8b3c44 • 以下のような内容です。 ◦

    顧客生涯価値(LTV,CLV)の数式変形 ◦ サブスクリプションの平均継続期間 (デュレーション)の数式変形 ◦ デュレーションと解約率変化に対する LTV変動率の関係 ◦ CAC Payback Periodの数式変形 ◦ ユニット・エコノミクスの数式変形
  23. 【参考】管理会計でよく使われる指標 • これまで説明した指標・管理会計でよく使われる指標の一覧 一般的な指標 概要 投資回収期間 初期投資を累積収益が上回るまでの期間 NPV 正味現在価値 IRR

    内部収益率 EBITDA 利払前・税引前・減価償却前利益 SaaS特有の指標 概要 ARR・MRR 経常収益 ACV・NewMRR 年間契約金額・新規の経常収益 チャーン(Churn) 解約のこと。カスタマーチャーン、レベ ニューチャーン等の定義がある ARPA・ARPU・ARPPU アカウント(ユーザー)あたりの年間平均 収益 CAC Payback Period 投資回収期間 LTV(CLV・CLTV) 顧客生涯価値 ユニット・エコノミクス LTVをCACで割ったもの NRR Net Revenue Retention(売上維持率)
  24. 【補足】EBITDA 決算資料では売上高や ARRなどと並んで「EBITDA」がハイライトされていました。 • EBITDA(Earnings Before Interest, Taxes, Depreciation and

    Amortization)               利息  税     減価償却費 ◦ 読み方は、イービットディーエー、イービットダー、イービッタなど ◦ Depreciation and Amortizationは減価償却費 ◦ 営業利益との比較では、減価償却費を引いていないのが大きな違い
  25. 利益をKPIに分解 • 営業利益をツリー構造で分解すると、売上を伸ばすために何をマーケティングや営業のの KPIにすべき か見えてくる 経常収益 (財務会計) 経常収益 (管理会計) 財管の誤差

    課金顧客数 (契約者数) 既存 課金顧客数 新規 課金顧客数 ARPA (基本料金) ARPA ARPA (従量課金) 前期 課金顧客数 商談数 解約率 成約率 経営KGI 現場の KPI 非経常収益 売上 売上原価 売上総利益 販管費 営業利益 売上原価 営業費用 営業員数 一人あたり 商談数 現状は成約率が低 いのか、活動量(商 談)が少ないのか、 何をKPIにするのが よいか
  26. 【補足】KPI, KGI, NSM • Key Goal Indicators(KGI) ◦ 重要目標達成指標。最終的な目標数値。通常は、利益や売上など •

    Key Performance Indicators(KPI) ◦ 重要業績評価指標 。CSF(Critical Success Factor:最重要プロセス)、あるいは、KFS( Key Factor for Success:事業成功の鍵)を数値で表したもの ◦ 本来は、鍵となる「一つ」の指標 • North Star Metric(NSM) ◦ 北極星のように目標への指標となる KGIとKPIの間に設定する指標 ◦ 本来は一つのはずの KPIをたくさん設定してしまった際に、 KGIとの中間指標を設定し、それを KPIと違う呼び方をしたい際などに用いられる • KPIツリー ◦ KGIをツリー構造でKPIに分解したもの
  27. 本セクションの推薦図書 • 朝倉祐介『ファイナンス思考』 ◦ https://www.diamond.co.jp/book/9784478103746.html • 吉村壮司他『CFOのためのサブスクリプション・ビジネスの実務』 ◦ https://www.biz-book.jp/isbn/978-4-502-39231-3 •

    中尾 隆一郎『最高の結果を出すKPIマネジメント』 ◦ https://www.forestpub.co.jp/author/nakao_ryuichirou/lp/kpi/ • 稲垣大輔他『Pythonではじめる 会計データサイエンス』 ◦ https://www.biz-book.jp/isbn/978-4-502-43811-0 • ウェス・ブッシュ『PLG プロダクト・レッド・グロース』 ◦ https://d21.co.jp/book/detail/978-4-7993-2784-5
  28. 売上とマーケティング・営業のKPI 売上(経常収益)をプロセスまで分解すると、 →売上をあげるために、マーケティングや営業がどの指標を高めればよいか見えてくる 経常収益 顧客数 既存顧客数 新規顧客数 ARPA (基本料金) ARPA

    ARPA (従量課金) 前期顧客数 商談数 解約率 成約率 リード数 アポ獲得率 営業が担うKPI マーケターが担うKPI 新規顧客数 トライアル 課金転換率 LP表示数 CVR 広告表示数 CTR Webの場合 *マーケティング指標の用語は後のスライドで説明
  29. Webマーケティングと営業 • どのようにターゲット顧客にアプローチし、競争優位性を保つか (GTM: Go-To-Market) 市場規模(顧客数) 多い 少ない(ニッチ・未開拓) プロダクトの複雑度 シンプルに使える

    オーダーメイドで複雑 顧客あたり売上・LTV 小さい 大きい ターゲットの例 個人向け、小規模企業向け 中堅・大企業向け、富裕層向け 会社名および商品・製品・サービス名(ロゴマーク等を含む)は、各社または各権利者の商標または登録商標です。 動画 表計算ソフト アプリ システム開発 経営者保険 精密機械 CRM
  30. Webマーケティングと営業 • どのようにターゲット顧客にアプローチし、競争優位性を保つか (GTM: Go-To-Market) 市場規模(顧客数) 多い 少ない(ニッチ・未開拓) プロダクトの複雑度 シンプルに使える

    オーダーメイドで複雑 顧客あたり売上・LTV 小さい 大きい ターゲットの例 個人向け、小規模企業向け 中堅・大企業向け、富裕層向け Go-To-Market戦略 プロダクト主導が多い セールス主導が多い 販売戦略 主にWebマーケティング 主に営業が企業のキーマンにアプローチ  顧客支援 テックタッチ(Web完結) ハイタッチ(人手で支援)
  31. Webマーケティング 未登録 アカウント登録 自社サイト トライアル 有料プラン 無料プラン ランディング ページ 関連キーワード

    検索表示 指名検索 表示 リスティング広告 表示 他社メディア サイト広告 解約 課金 退会 クリック コンバー ジョン マス メディア SNS 口コミ • 指名検索:自社ブランドや商材名を含むキーワード検索のこと • リスティング広告:ユーザーが検索したキーワードに連動して検索結果に表示される広告 • ランディングページ:検索結果や広告などを経由して訪問者が最初にアクセスするページのこと • Search Engine Optimization(SEO):検索エンジンの検索結果において、特定のウェブサイトが上位に表示されるよう調整する こと • Landing Page Optimization(LPO):コンバージョンがより多く発生するように、ランディングページを最適化すること 課金 解約 登録 フォーム
  32. Webマーケティング 未登録 アカウント登録 自社サイト トライアル 有料プラン 無料プラン ランディング ページ 関連キーワード

    検索表示 指名検索 表示 リスティング広告 表示 他社メディア サイト広告 解約 課金 退会 クリック コンバー ジョン マス メディア SNS 口コミ • ARR(経常収益) の分解を思い出しましょう • ACVを増加させたい→新規課金数を増やしたい→Conversion Rate(CVR)やトライアルからの課金転換率を向上したい • Churn (レベニューチャーン)を減少させたい→解約者数を減らしたい→解約率(カスタマーチャーンレート)を下げたい 課金 解約 登録 フォーム ARR = 前期ARR + ACV − Churn
  33. Webマーケティング 未登録 アカウント登録 自社サイト トライアル 有料プラン 無料プラン ランディング ページ 関連キーワード

    検索表示 指名検索 表示 リスティング広告 表示 他社メディア サイト広告 解約 課金 退会 クリック コンバー ジョン マス メディア SNS 口コミ • アカウント登録を増やすには ◦ Click Through Rate(CTR)=クリック数/表示回数 ◦ Conversion Rate(CVR)=アカウント獲得数/LP表示回数 ◦ アカウント登録を増やすには、CTRとCVRの掛け算を高める • CVRを高めるためにランディングページをA/Bテスト等で改善するLPOの担当者やCTRを高めるSEOの担当者などが協力し て、アカウント登録を増やしている 課金 解約 登録 フォーム
  34. 営業(セールス)とThe Model • The Modelは、Salesforce, Inc.で活用される分業型の営業プロセス • 営業プロセスを分解し、営業をマーケティング、インサイドセールス、フィールドセールス、カスタマーサ クセスで分業 インサイドセールス

    フィールドセールス セールス マーケティング カスタマーサクセス リード ナーチャリング 受注・新契約 商談 認知あり アポ・訪問 リテンション カスタマーサクセス 他プロダクトへのクロスセル 有望度↗
  35. 営業(セールス)とThe Model〜マーケティング〜 • リード(Lead):見込み顧客のこと • The Modelにおける狭義のマーケティングは、認知拡大してリードを作る役割 インサイドセールス フィールドセールス セールス

    マーケティング カスタマーサクセス リード ナーチャリング 受注・新契約 商談 認知あり アポ・訪問 リテンション カスタマーサクセス 他プロダクトへのクロスセル 有望度↗
  36. 営業(セールス)とThe Model〜カスタマーサクセス〜 • リテンション(Retention):既存顧客維持のこと • カスタマーサクセスは、リテンション率と LTV(クロスセル含む)を最大限引き上げる役割 インサイドセールス フィールドセールス セールス

    マーケティング カスタマーサクセス リード ナーチャリング 受注・新契約 商談 認知あり アポ・訪問 リテンション カスタマーサクセス 他プロダクトへのクロスセル 有望度↗
  37. 【補足】顧客ロイヤリティと顧客満足度の評価 • 顧客ロイヤリティ・・・他の製品・サービスへのスイッチを引き起こす可能性のある状況的影響やマーケ ティング努力が存在するにもかかわらず、将来もまた当該製品・サービスを再購入や再利用しようとす る強力なコミットメント →解約率が重要指標 • 顧客満足度(CS: Customer Satisfaction)・・・名称通り、顧客が満足している度合い

    →顧客満足度(CS: Customer Satisfaction)の指標の一つにNPS(Net Promoter Score)がある ◦ 「あなたはこの商品(サービス)を友人に勧めたいと思いますか?」という質問をし、「非常に満足し ており、ぜひ友人に勧めたい」を 10点満点とする1〜10の点数で回答 ◦ 9点ないし10点をつけた推奨者の割合から、 0〜6点をつけた批判者の割合を差し引くことで計算 ◦ コンサルティング・ファームのフレッド・ライクヘルドが提唱
  38. キャンペーンの「効果があった」とは? <キャンペーン効果あり> 500円 / 月 700円 / 月 (+200円) 1,500円

    / 月 (+1,000円) <キャンペーン効果なし> 500円 / 月 700円 / 月 (+200円) 700円 / 月 (+200円)
  39. 【再掲】「分ける」と何が「分かる」のか 過去と比べる ・先月と比べる ・前年同月と比べる 理想・目標 と比べる 他者(他社) と比べる 何と比較する? •

    集団を分けて、集団同士を比較する • 効果検証では集団の分け方を工夫する • 分けると比較がしやすくなる
  40. 【補足】効果検証 個体iに処置(treatment)を割り当てられたかを表す二値変数 Ti∈{0, 1}とし、Ti=1の集団を処置群(treatment group)、Ti=0の集団をコントロール群 (control group)という。潜在的結果変数 (potential outcomes)Yiを以下と する。

    • 個体因果効果(ICE: Individual Causal Effect) • 平均処置効果(ATE: Average Treatment Effect) • 処置群の平均処置効果 (ATT: Avarage Treatment effect on the Treated) Yi(1)かYi(0)のいずれかは観測されず、反事実または反実仮想 (Counterfactual)という。効果検証は、観測さ れない変数があるという因果推論の根本問題がある中で、 τATE(テーマによってはτATT)を推定することが目 的。
  41. 【補足】ランダム化比較試験 ランダム化比較試験 (RCT:Randomized Controlled Trial)は、 処置の割当Tiをランダムにすることで、観測さ れ た変数からτATEを推定する手法。 セレクション・バイアス (*Yi(1),

    Yi(0)とTiが独立のとき) • A/Bテストは施策対象をランダムにすることで、処置群とコントロール群の結果 の単純平均からバイアスを取り除いた平均処置効果が推定できる
  42. 【補足】統計的因果推論と計量経済学 実験(ランダム化比較試験 )できない状況で、平均処置効果 (ATE)、あるいは、処置群の平均処置効果 (ATT)を 推定することが主な目的。統計的因果推論は計量経済学でもよく使われる手法 近年、統計的因果推論 (計量経済学)の分野がノーベル経済学賞に選ばれている • 2019年 アビジット・V・バナジー,

    エステル・デュフロ, マイケル・クレーマー ◦ 著書に『政策評価のための因果関係の見つけ方』 • 2021年 デヴィッド・カード , ヨシュア・アングリスト , グイド・インベンス ◦ デヴィッド・カード:差分の差分法 (DID)の研究 ◦ ヨシュア・アングリスト:著書に『ほとんど無害な計量経済学』 ◦ グイド・インベンス:著書に『インベンス・ルービン 統計的因果推論』
  43. 【補足】そもそも、マーケティングとは • ピーター・F. ドラッカー『マネジメント』 ◦ 「企業の目的は、顧客の創造である。したがって、企業は二つの、そして二つだけの基本的な機能を持つ。それが マーケティングとイノベーションである。マーケティングとイノベーションだけが成果をもたらす。」 ◦ 「真のマーケティングは顧客からスタートする。すなわち現実、欲求、価値からスタートする。『われわれは何を売り たいか』ではなく、『顧客は何を買いたいか』を問う。」

    ◦ 「マーケティングの理想は、販売を不要にすることである。マーケティングの目指すものは、顧客を理解し、製品と サービスを顧客に合わせ、おのずから売れるようにすることである。」 • フィリップ・コトラー『マーケティング・マネジメント』 ◦ 「マーケティングとは人間や社会のニーズを見極めてそれに応えることである。マーケティングを最も短い言葉で定 義すれば『ニーズに応えて利益を上げること』になろう。」 ◦ 「アメリカ・マーケティング協会は、次のように定義している。『マーケティングとは、顧客に向けて価値を創造、伝達、 提供し、組織および組織をとりまくステークホルダーに有益となるよう顧客との関係性をマネジメントする組織の機 能および一連のプロセスである』」 ◦ 「マーケティング・マネジメントを『ターゲット市場を選択肢、優れた顧客価値を創造し、提供し、伝達することによっ て、顧客を獲得し、維持し、育てていく技術および科学』と考える」 【引用】 P.F.ドラッカー(著), 上田惇生(編訳)『マネジメント【エッセンシャル版】基本と原則』 ,ダイヤモンド社 Philip Kotler(著), Kevin Lane Keller(著), 恩藏直人(監修), 月谷真紀(訳)『コトラー&ケラーのマーケティング・マネジメント基本編』 ,丸善出版
  44. 【補足】コトラーのマーケティング5.0 • データドリブン・マーケティング :企業内外のさまざまな情報源からビッグデータ を集めて分析するとともに、マーケティン グ決定を促進し、最適化するためにデータエコシステムを構築 する活動 • 予測マーケティング :機械学習機能を備えた予測分析ツールを構築、使用するなどして、マーケティング活動の結果を開

    始前に予測するプロセス • コンテクスチュアル・マーケティング :顧客を識別し、プロファイリングした上で、物理的空間でセンサーやデジタル・イン ターフェースを活用して、顧客にパーソナライズされたインタラクションを提供する活動 • 拡張マーケティング :顧客に対応するマーケターの生産性を向上させるために、チャットボットやバーチャル店員など、人 間を模倣した技術をりようすること • アジャイル・マーケティング :分散型、部署横断型のチームを使って、製品やマーケティング・キャンペーンのコンセプトづく り、設計、開発、検証を迅速に行うこと アジャイル・ マーケティング データ ドリブン・ マーケティング 拡張・ マーケティング 予測・ マーケティング コンテクス チュアル・ マーケティング *フィリップ・コトラー他『コトラーのマーケティング 5.0』  https://publications.asahi.com/ecs/detail/?item_id=23523
  45. リードの有望度のスコアリングへの機械学習活用 アタックリストの作成に教師あり学習を活用 • 過去:大量のリードの中から、手動で時間をかけてアタックリストを作成して架電 • 現在:大量のリードの中から、機械学習で一瞬でアタックリストを作成して架電 リード データ モデル f(x,b)

    リードリスト スコア(予測値) クライアントA 55% クライアントB 40% クライアントC 30% クライアントD 25% モデルの予測値 (スコア)を出力 スコアをインサイ ドセールスのア プローチ優先度 に活用 受注結果
  46. 本セクションの推薦図書(ビジネス系) • フィリップ・コトラー他『コトラー&ケラーのマーケティング・マネジメント基本編 第3版』 • フィリップ・コトラー他『コトラーのマーケティング5.0』 ◦ https://publications.asahi.com/ecs/detail/?item_id=23523 • マーク・ジェフリー『データ・ドリブン・マーケティング』

    ◦ https://www.diamond.co.jp/book/9784478039632.html • アン・H・ジャンザー『サブスクリプション・マーケティング』 ◦ https://eijipress.co.jp/products/2255 • Ron Kohavi他『A/Bテスト実践ガイド』 ◦ https://www.kadokawa.co.jp/product/302101000901/ • ウェス・ブッシュ『PLG プロダクト・レッド・グロース』 ◦ https://d21.co.jp/book/detail/978-4-7993-2784-5 • 福田 康隆『THE MODEL 』 ◦ https://www.shoeisha.co.jp/book/detail/9784798158167 • ニック・メータ他『カスタマーサクセス』 ◦ https://eijipress.co.jp/products/2260 83
  47. 本セクションの推薦図書(技術系) • ジューディア・パール他『因果推論の科学』 ◦ https://books.bunshun.jp/ud/book/num/9784163915968 • ヤン・ルカン『ディープラーニング 学習する機械』 ◦ https://www.kspub.co.jp/book/detail/5238080.html •

    高橋 将宜『統計的因果推論の理論と実装』 ◦ https://www.kyoritsu-pub.co.jp/book/b10011781.html • 原泰史『Pythonによる経済・経営分析のためのデータサイエンス』 ◦ http://www.tokyo-tosho.co.jp/books/978-4-489-02350-7/ • Ilya Katsov『AIアルゴリズムマーケティング』 ◦ https://book.impress.co.jp/books/1117101147 • エステル・デュフロ他『政策評価のための因果関係の見つけ方』 ◦ https://www.nippyo.co.jp/shop/book/8075.html • ヨシュア・アングリスト他『「ほとんど無害」な計量経済学』 ◦ https://www.nttpub.co.jp/search/books/detail/100002252 • G.W. インベンス他『インベンス・ルービン 統計的因果推論』 ◦ https://www.asakura.co.jp/detail.php?book_code=12291 84
  48. 利益・売上の分解と事業のKPI*Key Performance Indicators(KPI): 重要業績評価指標 • 売上(経常収益)をプロセスまで分解すると、 ◦ 売上をあげるために、マーケティングや営業がどの指標を高めればよいか見えてくる • 事業計画・予算を策定する上で、各指標の中期的

    (3〜5年等)な見込みを立てる 経常収益 顧客数 既存顧客数 新規顧客数 ARPA (基本料金) ARPA ARPA (従量課金) 前期顧客数 商談数 解約率 成約率 見込み客数 アポ獲得率 86 市場 • 将来どのくらい顧客や認知を見込めるのか • どこに打ち手を講じると見込み客は増加しやす いのか 市場とは?市場規模とは
  49. 経営戦略と市場規模 •市場規模の推定 事業の見込み判断にはまず市場規模 (TAM: Total Addressable Market 等)を推定する必要がある *TAM: マネーフォワードでは、一定の前提の下、外部の統計資料や公表資料、当社サービス実績をもとに、マネーフォ

    ワードグループの5ドメインにおいて想定される潜在的な市場規模をそれぞれ推計 •コトラーのSTP • S: セグメンテーション ◦ 市場を類似したニーズを持つ顧客セグメントに細分化する • T: ターゲティング ◦ セグメントごとの販売機会を特定し、どのセグメントをターゲットにするか定める • P: ポジショニング ◦ 自社プロダクトをターゲット市場で特有の位置を占めるように設計 どのようなセグメントの分け方が良いか、各セグメントにおけるシェアはどの程度でどのセグメントの伸びしろ が大きいかの推定が必要
  50. B to B の市場規模〜「何社」かは定義次第〜 令和3年時点において、企業等の数は 368万存在する ※ と言われています ※総務省統計局『経済センサス』より さて、「BtoB」事業において市場規模を見積もるということについて考えてみましょう •

    BtoC: "Business to Consumer"の略(消費者向け事業) • BtoB: "Business to Business"の略(企業向け事業) ↑の「企業等の数」を市場規模と見なすには問題があります 企業?法人?会社? どの数字を市場規模とすればよいのか? 市場規模を見積もる際には、用語の定義を理解した上で事業に合わせた推定が必要
  51. BtoB市場を法人番号を元に定義していく マネーフォワードのバックオフィス向け SaaS部門の一部では市場を「企業」ではなく「法人」という粒度で捕捉し ようとしています 法人の最大の特徴 → 法人番号 が発番され、一般に情報が公開されている 法人番号 • 株式会社などの法人が持つ 13桁の番号(個人にとってのマイナンバーのようなもの

    ) • 国税庁が法人番号によって税の徴収がより確実かつ簡易なものとする目的で活用 • 法人の登記を行う際に必要で、国税庁法人番号公表サイトで一般に公開されている 法人番号が付与されている || 「法人税の納税義務がある」と国税庁に認識されている団体
  52. 法人データの利用方法 - gBizINFO gBizINFO(ジービズインフォ) • 政府保有の法人情報を法人番号に紐づけてデータ整理を行い、2次利用可能なオープンデータとして 情報提供するサイト • 法人として登記されている 約550万法人(2024/10時点)が対象とされており、国税庁の法人番号が

    ベースとなっている このように自社が直接入手した情報だけではなく、社外で収集されているデータを利用することで 市場規模推定などの 分析精度を向上 させることができます gBizINFOデータイメージ 法人番号 法人名 法人住所 電話番号 1111111111111 株式会社nomura 東京都千代田区 XXX-XXXX-XXXX 2222222222222 吉住株式会社 東京都港区 YYY-YYYY-YYYY 3333333333333 田中社団法人 神奈川県横浜市 ZZZ-ZZZZ-ZZZZ
  53. データ間の粒度の違い • 市場には法人が550万件が存在している • とある会社のプロダクトのユーザーアカウントは 55万件※存在する ※仮の数値です この場合 に必ずしも「とある会社は 10%の市場シェアを獲得できている」わけではなく、

    そう断言できない大きな要因の一つとして、 データ間の粒度の違い があります。 法人名 吉住株式会社 田中社団法人 アカウント名 吉住株式会社 人事部 吉住株式会社 経理部 田中社団法人 A事務所 田中公益財団 社外の法人データ 自社のアカウントデータ 実際の対応はN対Mの関係に なっているケースがある
  54. データの粒度の違いを解消する方法 - 名寄せ データの粒度の違いを解消する方法の一つとして「 名寄せ」というものがあります。 名寄せとは、同一の主体 (今回だと法人)に関連する複数のデータを一つにまとめることを指します。 ①法人番号をキーにして取りまとめ • 番号の一致を持って確実に同一であると判断できるのが強み

    • 必須取得としていないケースが多い(会社の業務において必須なものではないため) ②名称、住所、電話番号等をキーにして取りまとめ • 情報として収集しやすく欠損が少ないのが強み • 複数のデータ間で表記揺れ(略称、大文字小文字、漢数字英数字、ハイフン有無 etc)などの理由で完全一致させるのが難 しいことが多い。会社名も被りが多い。 ◦ 自然言語処理やAI/ML技術が発展しているが、100%の精度を目指すことはかなり困難 データA 法人名 法人住所 株式会社nomura 東京都千代田区〇〇 7-7-7 データB 法人名 法人住所 nomura Inc. 東京都千代田区〇〇七丁目 実は同一法人だが、 データ上保証できない
  55. マーケット概況と市場全体に対するKPIの把握 社外から法人データを入手し、そこに自社のリードや商談などのデータを名 寄せすることで、粒度の懸念を払拭した上で指標を出すことが可能になりま した。 こういった活動により、より確かな意思決定を行うことができるようになりま す。 6% 50% 67% 全法人

    リード(見込み客)法人 商談実施済法人 契約済法人 FY2024時点 550万件 FY2023時点 525万件 +4% FY2024時点 30万件 FY2023時点 25万件 +20% FY2024時点 15万件 FY2023時点 10万件 +50% FY2024時点 10万件 FY2023時点 8万件 +25% ※本頁で扱っている数値は全て仮のものです。 みなさんもこの数字を見て考えてみましょう!
  56. マーケット概況と市場全体に対するKPIの把握 社外から法人データを入手し、そこに自社のリードや商談などのデータを名寄せすることで、粒度の懸念を払 拭した上で指標を出すことが可能になりました。 こういった活動により、より確かな意思決定を行うことができるようになります。 6% 50% 67% リード獲得の余白はまだまだあ りそうだし、商談獲得ペースが 伸びてるからマーケティングの

    予算を増やしていこう 商談獲得の伸びに比べて契約 獲得の伸びが鈍いな … 前年度から新たに建設・不動 産業界の契約を増やそうとし たが、そのあたりの商談がう まくいっていない のかな? 全法人 リード(見込み客)法人 商談実施済法人 契約済法人 FY2024時点 550万件 FY2023時点 525万件 +4% FY2024時点 30万件 FY2023時点 25万件 +20% FY2024時点 15万件 FY2023時点 10万件 +50% FY2024時点 10万件 FY2023時点 8万件 +25% ※本頁で扱っている数値は全て仮のものです。
  57. セグメント別にマーケットを把握 名寄せで複数のデータの取りまとめを行うことで、 一方にしか存在しなかった情報を横断的に利用する こと ができます。今回のケースでは、社外の法人データでしか持ち得なかった顧客の業界情報を使って自社の リードや商談情報をセグメントに切って可視化・分析することが可能になります。 ※本頁で扱っている数値は全て仮のものです。 6% 87% 30%

    全法人 リード(見込み客)法人 商談実施済法人 契約済法人 FY2024時点 100万件 FY2023時点 95万件 +5% FY2024時点 6万件 FY2023時点 5万件 +20% FY2024時点 5万件 FY2023時点 2万件 +150% FY2024時点 1.5万件 FY2023時点 1万件 +50% 建 設 ・ 不 動 産 5% 45% 85% FY2024時点 450万件 FY2023時点 430万件 +4% FY2024時点 24万件 FY2023時点 20万件 +20% FY2024時点 10万件 FY2023時点 8万件 +25% FY2024時点 8.5万件 FY2023時点 7万件 +22% ↑ 以 外
  58. セグメント別にマーケットを把握 名寄せで複数のデータの取りまとめを行うことで、一方にしか存在しなかった情報を横断的に利用することが できます。今回のケースでは、社外の法人データでしか持ち得なかった顧客の業界情報を使って自社のリー ドや商談情報をセグメントに切って可視化・分析することが可能になります。 ※本頁で扱っている数値は全て仮のものです。 87% 30% 商談実施済法人 契約済法人 FY2024時点

    5万件 FY2023時点 2万件 +150% FY2024時点 1.5万件 FY2023時点 1万件 +50% 45% 85% FY2024時点 10万件 FY2023時点 8万件 +25% FY2024時点 8.5万件 FY2023時点 7万件 +22% 建設・不動産業界の商談がうまく いっていない という仮説は当たって いそうだ 建設・不動産業界を担当していた営 業担当に話を聞いてみて、必要に 応じてそれ以外の業界に営業リ ソースを戻していこう 建 設 ・ 不 動 産 ↑ 以 外
  59. 【補足】業種セグメント 農業、林業 漁業 鉱業、採石業、砂利採取業 建設業 製造業 電気・ガス・熱供給・水道業 情報通信業 運輸業、郵便業 卸売業、小売業

    金融業、保険業 業種として最も一般的なものは 日本標準産業分類 (JSIC)です。 このように既存の分類を活用することで市場を網羅的に分解することができます。 不動産業、物品賃貸業 学術研究、専門・技術サービス業 宿泊業、飲食サービス業 生活関連サービス業、娯楽業 教育、学習支援業 医療、福祉 複合サービス業 サービス業(他に分類されないもの) 分類不能の産業 【参考】e-Stat - 政府統計の総合窓口 https://www.e-stat.go.jp/classifications/terms/10
  60. 従業員規模セグメントとビジネス部門の関心(例) 従業員規模 法人数 1~4 4100000 5~9 800000 10~19 300000 20~29

    100000 30~49 70000 50~99 55000 100~299 40000 300~499 8000 500~999 5000 1000~1999 2000 2000~4999 1000 5000~9999 300 10000~ 150 従業員規模が小さい法人は獲得後の単価も低い 傾向があるはずなので、コストのかかる営業ではな くWebマーケの組織に任せよう (あまり関心なし ) ビジネス部門営 業部長 単価的に対面営業のコストがペイする層なのでこの 層を深掘り分析したい (関心あり) この層はより高単価だが、プロダクトがこの従業員 規模の業務に耐えられなくて提案が刺さらない か ら、プロダクト開発を待って翌年度考えよう (今は関心なし )
  61. 戦略→アクションを一貫させるためのデータの持ち方 各部署から報告された数値や調査会社の公開レポートを比較すれば、簡単な事業戦略・計画を立てる ことは可能です。 ただし以下のように法人単位でデータを整備することで、自社のデータの粒度を統一した上で各種 KPIの内訳 を分解できるようになり、 よりアクションに繋がりやすく なります。 市場データ 自社データ

    法人番号 法人名 法人住所 業種 従業員規模 リード化済み 商談実施済み 受注契約済み 1111111111111 株式会社nomura 東京都千代田区 情報通信業 500~999 TRUE FALSE FALSE 2222222222222 吉住株式会社 東京都港区 学術研究、専門・技術サービス業 300~499 TRUE TRUE FALSE 3333333333333 田中社団法人 神奈川県横浜市 不動産業、物品賃貸業 100~299 TRUE TRUE TRUE ・ ・ ・ 550万件
  62. 【補足】マネーフォワードにおける市場データの活用例 マネーフォワードが市場データを分析してアクションにまで繋げた例をいくつか紹介 • 白地(見込み客ですらない )層への直接架電 ◦ 契約に至る推移率の良い従業員規模&業種が可視化され、そのセグメントの白地法人も リストとして出力可能な状態となったことで実現可能に ◦ 法人間の資本関係も市場データに加えることで、法人グループ単位でのアタックも

    • 部署間を跨いだクロスセル (プロダクト追加提案 )・アップセル (プランアップグレード提案 ) ◦ 市場 - 自社データの名寄せができたことでリスト出力が容易に ◦ 特にWeb流入によって獲得した法人の内、大人数で利用してくれている法人に より多機能かつ高単価なプランの提案
  63. 経営データ分析で求められるデータの品質 これまでの章では、管理会計の指標が算出できる、あるいは、市場の推定などが実施できるデータが揃って いる前提で説明 • 誤ったデータを見てしまっていたら • 今見たいデータを見るのに数週間待たないといけなかったら • そもそもデータが見れなかったら •

    業務上の意思決定ができなかったり、誤ったりするかも • 顧客に誤請求やメール誤送信してしまうかも • データ分析ができなかったり、分析結果は意味を持たなかったりするかも データの品質 を高い状態に保つ必要がある 105
  64. データ品質とは データ品質 (の度合い)は、データが果たすべき目的 に合致しているかどうか • 品質の例として以下のような評価軸がある 品質評価軸の例 説明 正確性(狭義の品質) 正しいかどうか。現実世界との一致

    。合意されたデータソースとの一致 適時性・最新性 最新かどうか。分散されたデータの同時性。現在の世界との一致 アクセス可能性 アクセス可能か、利用可能か。データ取得の容易さ。アクセス制御 完全性 十分なデータか。必要なデータ(行・列・テーブル・スキーマ)が全て揃っている 一貫性 互いに合致しているか。データセット内やデータセット間でデータの等価性 【参考】政府CIOポータル「データ品質管理ガイドブック」 https://cio.go.jp/sites/default/files/uploads/documents/data_hinshitu_guide_beta.pdf →では、データ分析を目的としたとき、どのようなテーブルが分析しやすか 誤ったデータを見て しまっていたら データを見るのに時 間がかかったら データが見れなかっ たら
  65. 分析しにくいデータの例 「分析」という目的において、品質の低いデータ (分析しにくい )の具体例 を紹介 • 半角と全角の混在や名称のブレなどの表記ゆれ • 数値列に文字列など想定しないデータ型 •

    単位(円と万円など)の不明や混在 • データの重複や欠測 • ダミーデータ • 項目名の省略 • 一つのセルに複数の値 • データの分断(途中に空白行・空白列など ) • スプレッドシート(Excel)でのセルの結合 • 一つのシートに複数のテーブル • 一意性がないなどの非正規形 【参考】総務省統計局「統計表における機械判読可能なデータ作成に関する表記方法について」   https://www.soumu.go.jp/main_content/000723697.pdf  →河野大臣(2020年当時、行政改革担当大臣)のTweetでも拡散   https://twitter.com/konotarogomame/status/1331483895645097984 111 法人名 代表電話番号 株式会社nomura 088-8888-8888 nomura Inc. 8888888888 田中コーポレーション 株式会社dummy 111-1111-1111
  66. 【補足】欠測と重複 データの欠測(欠損ともいう)があるとなぜ問題なのか • 例えば、取引があるのに売上データがないと売上を過小評価してしまい、最悪、顧客やステークホル ダーに迷惑をかけてしまう • 例えば、顧客マスタに欠損があることに気付かず結合してしまうと、地域ごとの売上を誤って集計してし まう • 欠測のことを「NULL(ヌル)」ともいう

    (*補足:統計的因果推論やプログラミングの文脈ではなく、業務上の問題で生じる欠測について述べており、 統計やプログラミングの用語としては、厳密には欠測と Nullは同じではありません ) データの重複があるとなぜ問題なのか • 例えば、取引が二重計上されると売上を過大評価してしまい、最悪、顧客やステークホルダーに迷惑を かけてしまう • 例えば、顧客マスタに重複があることに気付かず結合してしまうと、地域ごとの売上を誤って集計してし まう • 重複がないこと=「一意 (ユニーク)」という
  67. 整然データ どちらが整然データでしょうか Hadley Wickham "Tidy Data" https://vita.had.co.nz/papers/tidy-data.pdf 地点 6時 12時

    18時 札幌 晴れ 晴れ 曇り 東京 曇り 雨 雨 福岡 雨 晴れ 晴れ 地点 時刻 天気 札幌 6時 晴れ 札幌 12時 晴れ 札幌 18時 曇り 東京 6時 曇り 東京 12時 雨 東京 18時 雨 福岡 6時 雨 福岡 12時 晴れ 福岡 18時 晴れ
  68. 整然データ どちらが整然データでしょうか Hadley Wickham "Tidy Data" https://vita.had.co.nz/papers/tidy-data.pdf 地点 6時 12時

    18時 札幌 晴れ 晴れ 曇り 東京 曇り 雨 雨 福岡 雨 晴れ 晴れ 地点 時刻 天気 札幌 6時 晴れ 札幌 12時 晴れ 札幌 18時 曇り 東京 6時 曇り 東京 12時 雨 東京 18時 雨 福岡 6時 雨 福岡 12時 晴れ 福岡 18時 晴れ
  69. 地点 6時 12時 18時 札幌 晴れ 晴れ 曇り 東京 曇り

    雨 雨 福岡 雨 晴れ 晴れ 地点 時刻 天気 札幌 6時 晴れ 札幌 12時 晴れ 札幌 18時 曇り 東京 6時 曇り 東京 12時 雨 東京 18時 雨 福岡 6時 雨 福岡 12時 晴れ 福岡 18時 晴れ 整然データ • 個々の変数が1つの列をなす
  70. 地点 6時 12時 18時 札幌 晴れ 晴れ 曇り 東京 曇り

    雨 雨 福岡 雨 晴れ 晴れ 地点 時刻 天気 札幌 6時 晴れ 札幌 12時 晴れ 札幌 18時 曇り 東京 6時 曇り 東京 12時 雨 東京 18時 雨 福岡 6時 雨 福岡 12時 晴れ 福岡 18時 晴れ 整然データ • 個々の観測が1つの行をなす
  71. 整然データ • 個々の観測の構成単位の類型が 1つの表をなす 地点 時刻 天気 札幌 6時 晴れ

    札幌 12時 晴れ 札幌 18時 曇り 東京 6時 曇り 東京 12時 雨 東京 18時 雨 福岡 6時 雨 福岡 12時 晴れ 福岡 18時 晴れ 地点 時刻 天気 札幌 6時 晴れ 東京 6時 曇り 福岡 6時 雨 地点 時刻 天気 札幌 12時 晴れ 東京 12時 雨 福岡 12時 晴れ
  72. 整然データ • 個々の値が1つのセルをなす 地点 時刻 天気 札幌 6時 晴れ 札幌

    12時 晴れ 札幌 18時 曇り 東京 6時 曇り 東京 12時 雨 東京 18時 雨 福岡 6時 雨 福岡 12時 晴れ 福岡 18時 晴れ 地点 時刻 天気 札幌 6時,12時 晴れ 札幌 18時 曇り 東京 6時 曇り 東京 12時,18時 雨 福岡 6時 雨 福岡 12時,18時 晴れ
  73. 整然データ Hadley Wickham "Tidy Data" https://vita.had.co.nz/papers/tidy-data.pdf 地点 時刻 天気 札幌

    6時 晴れ 札幌 12時 晴れ 札幌 18時 曇り 東京 6時 曇り 東京 12時 雨 東京 18時 雨 福岡 6時 雨 福岡 12時 晴れ 福岡 18時 晴れ • 個々の変数が1つの列をなす • 個々の観測が1つの行をなす • 個々の観測の構成単位の類型が 1つの表をなす • 個々の値が1つのセルをなす クロス集計やグラフ化 (BI化)しやすい
  74. データクレンジング ほとんどのデータは「分析すること」以外を目的として生成・収集されています。例えば … • 営業由来のデータ : 営業の活動見込み・実績を管理するために生成・収集する • プロダクト由来のデータ : プロダクトの機能を実現するために生成・収集する 故にはじめから分析しやすいデータというのはほとんど存在せず、データをきれいに整形する前処理が必要となります。こ の前処理をデータクレンジングといいます。 •

    データクレンジングに使われるプログラミング言語やライブラリ、ツール等 ◦ SQL(BigQuery, Redshiftなど) ◦ Pythonのpandas(その他、Polarsなど) ◦ Rのdplyr, data.table ◦ Excel・Google スプレッドシートなど表計算ツール ◦ その他、分析の言語やツール ▪ Julia, Spark, SAS, SPSS, Stata, Tableau Prep, MATLAB等 →ぜひ、表計算ツールに加え、まずはいずれか一つの言語を使えるようになりましょう! とはいえ、経営層・従業員全員が、SQLなどを使いこなせるわけではない・・・ 122
  75. データの民主化 経営層・従業員全員が、 SQLなどを使いこなせるわけではない・・・ • データの民主化 ◦ 組織の意思決定する人たち誰も が、見たい情報 にハードルなくアクセスでき、適切にデータを活 用して意思決定に繋げられる状態の継続的な実現(当社内定義)

    ◦ そのために必要なこと ▪ データの品質を担保する分析環境 • 必要なタイミングで(適時性)、信頼できる集計結果に (正確性)、アクセスできる(アクセ ス可能性)環境 ▪ データそのもの • 必要なデータ(アクセスログや営業の活動履歴等 )を集めて、蓄積していること ▪ データ・ハンドリングのスキルを持った人材 • 必要な指標の定義を理解した上で、 SQL等で扱える人材 ▪ データ・ドリブンな意思決定をする文化 123
  76. 管理会計と現場のKPIの連動 • 経営層・マネジャー・メンバーなど意思決定者ごとに見たい情報は異なる • 理想は、管理会計とマーケティング・営業など現場の KPIが繋がっている状態 MRR (財務会計) MRR (管理会計)

    財管の誤差 課金 ユーザー数 既存 ユーザー数 新規 ユーザー数 ARPA (基本料金) ARPA ARPA (従量課金) 前月 ユーザー数 自然流入 解約率 広告流入 経営層の見たい情報 マネジャー層の見たい情報 メンバーの見たい情報 管理会計とKPIの連動 経営KGI 現場の KPI • データ品質・適時性の問題 • 販売方法の多様化(Webサイト・ア プリ・営業など)の施策 • 意思決定主体や組織ごとにばらつく 集計定義 見ている数字がずれ、 意思決定が困難になる
  77. 【補足】データ分析基盤〜データレイク・データウェアハウス・データマート〜 データレイク・データウェアハウス(DWH)・データマートの層に分けてデータ分析基盤を構築することで、データの品質を担保しや すくなり、複数の意思決定主体の様々なユースケースでデータ活用しやすくなる ローデータ データレイク DWH データマート ユースケース 課金履歴 CRMツール

    アクセスログ 各プロダクト DB 課金履歴 CRMツール アクセスログ 各プロダクト DB 売上 SaaS KPI (管理会計) 月次売上 (財務会計) ロー(生)データ。業務影 響を避けるため直接分 析利用はしない ローデータをそのまま コピーしたテーブル レークのテーブルを加 工したマートへ加工し やすいテーブル ユースケースに対応し たテーブル ダッシュボードで KPIモニタリング 経理業務 (財務会計作成) LPOの 効果検証 処置有無と クリック結果 データのビジネス用途 メタデータ
  78. メタデータとデータカタログ どんなにデータ品質を高め、 KPIの定義を統一できたとしても …データを見ただけでは何も分からない メタデータとデータカタログによって、知っている人に聞かずとも ↑の悩みを解決できる • メタデータ とは、「データに関するデータ」 ◦

    主にデータセット、テーブルおよびカラムの定義と説明 ◦ データ責任者の連絡先なども合わせて管理しておくだけで 必要に応じハイコンテクストなデータの仕様や活用方法も確認可能に • データカタログ は、メタデータ管理ツール ◦ 企業が所有するデータ資産に関するメタデータを集約、整理し、 利用者がデータを効率的に検索、利用できるようにするツール メタデータ・データカタログの整備も分析に不可欠な営みの一つ 129 計上日 納品日 請求日 売上 2024-10-01 2024-09-30 2024-10-20 50000 月次売上高(税抜)を集計したいけど... どの日付を使えば良い??? 売上は税抜なのか???
  79. より広い視点、データマネジメント データ活用のためのデータマネジメントのデファクト・スタンダードとして、 DMBOK(Data Management Body of Knowledge)という本がある。この章で扱ったのは、データマネジメントの一部のテーマの導入部分のみ • データガバナンス •

    データ取扱倫理 • データアーキテクチャ • データモデリングとデザイン • データストレージとオペレーション • データセキュリティ • データ統合と相互運用性 • ドキュメントとコンテンツ管理 • 参照データとマスタデータ • データウェアハウスとビジネスインテリジェンス • メタデータ管理 • データ品質
  80. より広い視点、データマネジメント DMBOKという本の冒頭は次の一文ではじまる 「データは企業にとって重要な資産である。」 データと情報は、情報経済にとって「通貨(data as currency)」であり、「企業の生命線(data as life blood)」であり、さらに「新しい原油(the new

    oil)」とさえ呼ばれるようになった。組織が データ分析に価値を置くかどうかにかかわらず、 データなしではビジネスの遂行すらできな い。 *DMBOK(Data Management Body of Knowledge)  https://www.dama.org/cpages/body-of-knowledge
  81. 【補足】データ資産の価値 コスト • 取得・保存コスト ◦ データの取得と保存にかかるシステムコス ト • 品質コスト ◦

    存在しなくてはならないデータの欠如 ◦ データが欠落している場合の組織への影 響 ◦ 喪失したデータを復元するコスト ◦ 存在してはならないデータの存在 ◦ 顧客、企業の財務、評判に害を与える不正 確なデータ ◦ データの改善にかかるコスト • リスク対応コスト ◦ データに関連するリスク軽減コストとリスク を抱えることの潜在的コスト 収益 • 品質価値 ◦ より高品質なデータから受ける価値 ◦ ビジネスプロセスが滑らかになる価値 • 活用・意思決定から生まれる価値 ◦ ビジネスインテリジェンス(BI)で特定された好 機を活かすことから得られる収益の価値 ◦ 斬新な方法でデータを利用した場合に期待 できる価値 • 市場流通価値 ◦ データを販売することで得られる価値 ◦ データを取引に利用することで得られる価値 データは価値をもつ→データの価値は経済的観点で評価可能であり評価されるべき
  82. 本セクションの推薦図書 • 『データマネジメント知識体系ガイド 第二版』 ◦ https://bookplus.nikkei.com/atcl/catalog/18/270160/ • ゆずたそ他『実践的データ基盤への処方箋』 ◦ https://gihyo.jp/book/2021/978-4-297-12445-8 •

    Wes McKinney『Pythonによるデータ分析入門 第3版』 ◦ https://www.oreilly.co.jp/books/9784814400195/ • 原泰史『Python/Excel/SQLによる経済・経営分析のためのデータ処理入門』 ◦ http://www.tokyo-tosho.co.jp/books/978-4-489-02394-1/
  83. 【補足】AI(人工知能)とは • AI(Artificial Intelligence)とは、 ◦ 近年AIはいろんな定義で用いられるが、 AIという言葉は、アメリカのダートマス大学での研究プロ ジェクトを提案するプロポーザルで 1955年ジョン・マッカーシーによって初めて用いらた。 ◦

    そのプロポーザルでは、自然言語処理やニューラルネットなど 7項目を人工知能の課題としてい た。 ◦ 人工知能の概念は、ダートマス会議の数年前、 1950年アラン・チューリングの "COMPUTING MACHINERY AND INTELLIGENCE"が代表的で、現在ではチューリング・テストとして知られて いる。 ◦ チューリング・テストは、質問する人間に、機械が人間が回答していると判断するように仕向け、 その判断である機械が「人間的」かどうかを判定するテスト。 ◦ 誰かがコンピュータに (人間のような)何かをさせる方法を見つけるたびに、人々が「それは (人間 のような)知能ではない」ことを見出すことを AI効果という(Pamela McCorduck)。「AIはその時点で 未だなされていないもののことである」 (ラリー・テスラー)と皮肉を込めていわれる。
  84. 【補足】GPT、LLM、生成AIとは • GPT(Generative Pretrained Transformer)とLLM(Large Language Model) ◦ この数年、AIがビジネスで大きな脚光を浴びている要因の一つは ChatGPT

    ◦ 2014年にヨシュア・ベンジオ (2018年にチューリング賞受賞 )の研究室が論文"Neural machine translation by jointly"でAttentionという仕組みを発表。 Googleの研究チームが論文 "Attention Is All You Need"でAttentionを用いたアーキテクチャを Transformerと名付けた。2022年に OpenAIがChatGPTを公開。 ◦ 大規模言語モデル(LLM: Large Language Model)は、多数のパラメータ (例えばGPT-3で2000億 弱)を持つニューラルネットワークの言語モデル。 GPTやBERTなど。 ◦ テキストや画像(例としてStable Diffusion)等を生成するAIを生成AI(Generative AI)という
  85. 【補足】イノベーションとは イノベーションは「技術革新」と訳されることも多いが、決して技術に限らない • ピーター・F. ドラッカー『イノベーションと企業家精神』 ◦ 「イノベーションは技術に限らない。モノである必要さえない。それどころか 社会に与える影響力において、新聞や保険をはじめとする 社会的 イノベーションに匹敵するものはない」

    ◦ 「新しいものを生み出す機会となるものが変化である。イノベーションとは意識的に組織的に変化を探すことである。それらの変化が提供する 経済的、社会的イノベーションの機会を体系的に分析することである。通常それらの変化は、 すでに起こった変化や起こりつつある変化であ る。成功したイノベーションの圧倒的に多くが、そのような変化を利用している。」 イノベーションの概念を最初に提唱されたのは経済学者ヨーゼフ・シュンペーターと言われる • シュンペーター『経済発展の理論』で「新結合」というイノベーションに相当する言葉を次のように定義 ◦ 新しい財貨、すなわち 消費者の間でまだ知られていない財貨、あるいは新しい品質の財貨の生産 ◦ 新しい生産方法、すなわち当該産業部門において、実際上未知な生産方法の導入。これは決して科学的に新しい発見に基づく必要はなく、ま た商品の商業的取り扱いに関する新しい方法も含んでいる ◦ 新しい販路の開拓。すなわち当該国の当該産業が従来参加していなかった市場の開拓。ただしこの市場が既存のものであるかどうかは問わ ない。 ◦ 原料あるいは半製品の新しい供給源の獲得。この場合においても、この供給源が既存のものであるかー単に見逃されていたのか、その獲得 が不可能とみなされていたのかを問わずーあるいは初めて作り出されねばならないのかは問わない。 ◦ 新しい組織の実現。すなわち独占的地位 (例えばトラスト化による )の形成あるいは独占の打破 【引用】 P.F.ドラッカー(著), 上田惇生(編訳)『イノベーションと企業家精神【エッセンシャル版】』 ,ダイヤモンド社 シュム ペーター(著), 塩野谷祐一 (訳) , 中山伊知郎 (訳) , 東畑精一 (訳)『経済発展の理論』 ,岩波文庫
  86. 生成AI・大規模言語モデルで経営データ分析はどう変わりうるか • SQLを書くスキルのないビジネス担当者でも自然言語で見たい情報を (ダッシュボード化していない情報 であっても)見ることができるようになる データベース 自然言語での質問 「今月のユーザー増加数は?」 自然言語での回答 「1万ユーザーです」

    *参考に生成したSQL自体も付ける メタデータ メタデータと質問 からSQL生成 SQLの結果の集計数値 SQLを実行 • データ分析基盤やメタデータの整備はより一層重要に • SQLを読めるスキルは全員でなくても一定数の担当者には必要
  87. 本セクションの推薦図書 • シュム ペーター『経済発展の理論』 ◦ https://www.iwanami.co.jp/book/b248630.html • P.F.ドラッカー『イノベーションと企業家精神』 ◦ https://drucker.diamond.co.jp/works/detail/20.html

    • クレイトン・クリステンセン『イノベーションのジレンマ』 ◦ https://www.shoeisha.co.jp/book/detail/9784798100234 • チャールズ・A・オライリー他『両利きの経営』 ◦ https://str.toyokeizai.net/books/9784492534519/ • ヤン・ルカン『ディープラーニング 学習する機械』 ◦ https://www.kspub.co.jp/book/detail/5238080.html • 岡野原大輔『大規模言語モデルは新たな知能か』 ◦ https://www.iwanami.co.jp/book/b625941.html  • Alan. M. Turing "COMPUTING MACHINERY AND INTELLIGENCE" (1950) • John McCarthy, Marvin L. Minsky, Nathaniel Rochester, and Claude E. Shannon "A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence" (1955)
  88. Special Thanks 本資料の作成にあたり、資料の一部をご提供いただいた弊社のメンバーに感謝いたします。 さの @SanoNatsuki さん 管理会計の章の実務事例と営業の章のリードスコアリング事例の資料 渡會 さん Webマーケティングの章の

    A/Bテスト事例の資料 田宮 さん Webマーケティングの章のキャンペーン効果検証の資料 田中 さん 事業戦略・事業計画と企業データの章の資料 えさ @0610Esa さん データマネジメントの章のデータの民主化・ダッシュボードの資料