作成者 :しんゆう ブログ :データ分析とインテリジェンス https://analytics-and-intelligence.net/ Twitter:https://twitter.com/data_analyst_
データ分析は 「次にどうするかを決めるため」 にやること 2021/09/21
View Slide
本資料について • 本資料は2021年9月に某社にて行った講演資料です • 講演のアーカイブはありません • 内容は全て発表開始時点における私見です。後日意見が変わっているかもしれませんがご了承ください
自己紹介 • 名前:しんゆう @data_analyst_ • 最近の活動:データを使いやすくする人 (データアーキテクトまたはデータ整備人) • ブログ:データ分析とインテリジェンス https://analytics-and-intelligence.net スライドが表示されているページの下段にある説明欄からもリンクがあります
目次 • 前提:「データ分析」はプロセスである • 「データ分析」は意思決定のために行う • 「データ分析」にまつわるいろいろな話
前提:「データ分析」はプロセスである • 本資料における「データ分析」とは「意思決定と分析のプロセス」の「要求」から「伝達」フェーズをさす • つまり、目的を達成するための意思決定を助ける • 「データが与えられてそれを何とかする」 =「処理」と「洞察」のフェーズではないので注意 目的の決定要求 収集 処理 洞察 伝達 意思決定と実行フィードバック
料理に例えると • 意思決定と分析のプロセスは料理に例えるとわかりやすい • 「データ分析」とは「注文に応じた料理を作ること」
「データ分析」は意思決定のために行う• どんな言い方をしていても最終的には「次にどうするか意思決定するため」であることは共通している(はず) • 例外:投資として事前に「データ」を作っておくことも「データ分析」と呼ぶこともある。長期的には何かの意思決定に使われることが想定されている • 「処理」と「洞察」(あるいは「処理」だけ)をさして「データ分析」あるいは「分析」と呼ぶこともあるが意思決定を無視していたらただの「数字いじり」
データ分析は「予測や推論」• 「データ分析」とは次のことを決めるためなので、未来のことを考えているとも言える • 未来のことなので「予測や推論」が必要 • 意思決定に必要なのは「過去の売上」ではなく「今後の売上はどうなるのか」 • 過去の事実やニュースだけではいくら量があっても次にどうするか決められない
データ分析は「不確実性を減らす試み」• もしデータ分析で完璧な予測が出来たら「確実」に決めることができるがそんなことはできない • 完璧な予測ができないからとにかくやってみる、も違う • その中間にある「次にやることの不確実性を減らす試み」と表現するのがよさそう
データ分析=どの道をいくとどうなるか• 見知らぬ土地で道が3通りある時、確実に間違いな道がわかればそれを選択肢から外せばうまくいく確率は増える=不確実性を減らす • 「どの道を行くか決める」ために「どの道をいくとどうなるのかを調べる」のがデータ分析 • 地図を捜す、地元の人に聞いてみる、実際に行ってみるなど方法はいろいろ。地図がないこともれば、あっても間違っているかも
「データ分析」にまつわるいろいろな話• 「データ分析とは何か」の話はおわり。ただ、これだけでは伝わりづらいと思う • そこで「データ分析」を題材にしていろいろな面から見ることでうまく捉えられるようにできないか、と考えた • 順番と重要度の関係はない。自分が受け入れられやすい話を選んでもらえればいい • むしろここからが本番(?)
「データ分析」はだれでもやっていること • 「勘と経験と度胸(KKD)」ではなく「データ分析による意思決定」と別物のように言われることもあるが間違い • 経験とはすなわちその人が持っている「データ」であり勘とは「洞察」とも言える • つまり「データ分析」はだれでもやっていること • その時に自分の持っているデータ(経験)だけから考えるか、目的にあわせてデータを外部から取ってくるかの違い • 自炊で全部済ませるか、レストランにも行くかはその人が何を求めるか次第
決まっているなら実行したほうがいい• 表現や名称はともかく「データ分析」は「次にどうするかを決めるため」にやること • 言い換えると「次に何をするかが決まっている」=「意思決定が終わっている」ならばさっさと実行したほうがいい • 「何かやらなければいけない」ではなく「現状維持」もまた意思決定の1つ
• データ分析は「決めるため」なので実は「P」の一部 • Cだけを「分析」と考えてしまうとPのための分析が抜ける=勘と経験と度胸(KKD)で企画することになる • Pを作るための予測や調査がデータ分析 PDCAとデータ分析目的の決定要求 収集 処理 洞察 伝達 意思決定と実行フィードバックP D
• データ分析は「決めるため」なので実は「P」の一部 • CはPの振り返りなので目的は決まっており「何をチェックするか」から始まる • AはCに基づいての実行 • 重要なことはPのためのデータ分析を忘れないこと PDCAとデータ分析目的の決定要求 収集 処理 洞察 伝達 意思決定と実行フィードバックC A
全部「データ分析」のための手段 • 個別に扱われがちだが全部「データ分析」のための手段 ○ 数理モデリング/機械学習/クロス集計/〇〇法 ○ A/Bテスト/効果測定/可視化 ○ 定量/定性、〇〇分析/〇〇リサーチ ○ SQL/Python/R/各種プログラムやツール • 目的に合わせて手段を選ぶことが重要。自分ができなければ他の人の力を借りる。自分ができる/やりたいことから初めてはいけない
「データ」と「インテリジェンス」の違い • 「データ分析」の別の表現もある • 「意思決定のために必要な情報」とは「特定の意思決定のために洞察して得られた予測や推論」であり、それを「インテリジェンス」と呼ぶ • 「情報」には「データ」と「インテリジェンス」がある • 「インテリジェンス」以外の「情報」は全て「データ」
データ分析=インテリジェンスを作る • 「データ分析」とは「データからインテリジェンスを作るプロセス」ともいえる データ全体は実質的に無限。一方で知りえることはその中のほんのわずか
「データ分析」だが「データ」を作っている• 「データ分析」といいつつも「インテリジェンス」ではなく「データ」を作っている場合がある • 今ある課題に対する意思決定につながらないが、欲しいと思ってからでは間に合わないので事前に分析を行う • 「特定の企業が作るデータ」は市場調査/競合調査/顧客満足度調査/画像判別/基礎統計等 • 注意:長期的には何かしらの意思決定のために使われることが想定されている。誰かが「インテリジェンス」にしないなら「データ」を作っても貢献しない
都合のいい分析を要求されたら問いを変える• 「次にこうしたいからこういうデータが欲しい」に答えるなら「データ分析」とは別の何か • 自分が分析担当でその要求が「前回のキャンペーンがうまくいったように見せたい」なら「前回のキャンペーンがどうだったかを客観的に調べる」と返す。良し悪しの判断は分析者ではなく意思決定者にまかせる
目的を決めないデータ分析は無駄になる目的や解くべき課題知るべきこと集めるデータ処理の手法• 目的を決めないで「データ分析」を初めても「目的や解くべき課題」のためにならないかもしれない • 意思決定者と背景や優先順位を共有していないのにプロセスの途中から始めた「データ分析」がうまくいったとしたら丸投げされているか、ただの偶然 自分が使ってみたい手法から初めてデータを集めて分析しても解くべき課題に繋がっていなければ無駄になるだけ 本当に必要なデータはこちらかもしれない
背景を共有しないと分析が無駄になる例東京から熱海に行く移動手段/宿/食事移動手段ごとの違い一覧にして比較• いくら羽田発着の飛行機の情報が網羅されていても行く場所によっては何の役にも立たない • どこか行きたいので任せた(丸投げ)、ちょうど北海道に行くつもりだった(偶然)なら使われるかも • 「分析したのに使われない」原因になっていないか注意 熱海に行くのに羽田から飛行機にのる人は多分いないのでどんな分析も無駄になる 新幹線/バス/車
まとめ• 正解は無い • データ分析について自分なりに考えたらよさそうなこと ○ 意思決定に必要なことはなにか(今回の話) ○ 求められている役割はどこか ○ 責任を全うするためには何が必要か • 概念だけでは実務には使えないので求められている役割に必要なスキルを身に着けるようにしよう ご質問などあればお気軽にご連絡ください しんゆう @data_analyst_