Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DTD_はじめての因子分析_理論とビジネス活用.pdf
Search
BrainPad
December 18, 2025
Technology
0
11
DTD_はじめての因子分析_理論とビジネス活用.pdf
BrainPad
December 18, 2025
Tweet
Share
More Decks by BrainPad
See All by BrainPad
【採用候補者向け】BrainPad AAAご紹介資料
brainpadpr
0
630
DTD_TensorRTを用いた自然言語処理モデルの高速化
brainpadpr
0
9
DTD_生成AIアシスタントのコスト最適化
brainpadpr
1
130
白金鉱業Vol.21【初学者向け発表枠】身近な例から学ぶ数理最適化の基礎 / Learning the Basics of Mathematical Optimization Through Everyday Examples
brainpadpr
1
560
三田データ_BrainPadAAA_AIエージェント元年を振り返る
brainpadpr
1
160
DTD_メタデータ管理とデータ品質管理の具体化
brainpadpr
0
170
DTD_これから始めるMCP基本のキ
brainpadpr
2
240
DTD_大規模開発を加速するAI活用術
brainpadpr
0
77
綺麗なデータマートをつくろう_データ整備を前向きに考える会 / Let's create clean data mart
brainpadpr
3
930
Other Decks in Technology
See All in Technology
Zephyr RTOS の発表をOpen Source Summit Japan 2025で行った件
iotengineer22
0
260
GitHub Copilot CLI 現状確認会議
torumakabe
12
4.6k
Kaggleコンペティション「MABe Challenge - Social Action Recognition in Mice」振り返り
yu4u
1
750
Oracle Cloud Infrastructure:2026年1月度サービス・アップデート
oracle4engineer
PRO
0
140
サイボウズ 開発本部採用ピッチ / Cybozu Engineer Recruit
cybozuinsideout
PRO
10
72k
re:Inventで見つけた「運用を捨てる」技術。
ezaki
1
140
The Engineer with a Three-Year Cycle
e99h2121
0
160
Data Intelligence on Lakehouse Paradigm
scotthsieh825
0
200
書籍執筆での生成AIの活用
sat
PRO
1
210
AWS Devops Agent ~ 自動調査とSlack統合をやってみた! ~
kubomasataka
2
200
Amazon Bedrock AgentCore EvaluationsでAIエージェントを評価してみよう!
yuu551
0
170
Lambda Durable FunctionsでStep Functionsの代わりはできるのかを試してみた
smt7174
2
140
Featured
See All Featured
Designing for Performance
lara
610
70k
Automating Front-end Workflow
addyosmani
1371
200k
Un-Boring Meetings
codingconduct
0
190
Done Done
chrislema
186
16k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
Code Reviewing Like a Champion
maltzj
527
40k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
KATA
mclloyd
PRO
33
15k
Odyssey Design
rkendrick25
PRO
0
470
Information Architects: The Missing Link in Design Systems
soysaucechin
0
750
Documentation Writing (for coders)
carmenintech
77
5.2k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
36k
Transcript
はじめての因子分析 理論とビジネス活用 2025年 12月18日
©BrainPad Inc. Strictly Confidential 2 自己紹介 ・経歴: ・ 2013年 医療機器の会社に勤務
・ 2021年 フリーランスのDSとして活動 ・ 2025年 株式会社ブレインパッド 入社 ・プロジェクト経験: ・小売業でのデータ分析基盤の構築 ・統計関連の案件 ・趣味: ・統計学の勉強 ・ボードゲーム ・子供と遊ぶ
©BrainPad Inc. Strictly Confidential 3 自己紹介 • 今回は統計学のお話になります • 統計学で最近勉強した因子分析関連の話に焦点を置いて話します
• 理論の部分は数式が難しいので、流れなどを中心に説明できればと思います
1. 概要 2. クラスタリング 3. 因子分析 4. おわりに
©BrainPad Inc. Strictly Confidential 5 因子分析 1. どんなものか? たくさんのデータの背後にある「共通の要因(=因子)」を推定する統計手法です ※詳しくは後述します
2. どういう時に使えそうか? 教育:生徒の能力にあたる因子を推定 (例:計算が早い、運動が苦手) マーケティング:購買動機にあたる因子を推定 (例:持ち運びやすい、デザインが良い) →次に具体例で考えてみましょう 1. 概要
©BrainPad Inc. Strictly Confidential 6 • アンケートデータの分析について考えてみます 1. 背景: ・技術者向けの会員制サービスを作っている
・この会員の退会率が課題となっており、直接的な要因もはっきりしなかった 2. 実施内容: ・要因を推定するためにユーザー向けアンケートを実施した ・機能性、コストなどの中で「どれが退会の引き金になっているか?」を推定する 1. 概要 → 設定した例 概ね 満足 何か 不満
©BrainPad Inc. Strictly Confidential 7 • アンケート分析の狙いと手法 • ①どんな回答をした人が退会する? •
②退会の決め手となる要因は何か? • アンケート結果と退会の関連性を見たい • 「項目が多岐にわたり傾向が掴みにくい」状態を解消したい 1. 概要 概ね 満足 何か 不満
©BrainPad Inc. Strictly Confidential 8 • アンケート分析の狙いと手法 • ①どんな回答をした人が退会する? •
②退会の決め手となる要因は何か? • アンケート結果と退会の関連性を見たい • 「項目が多岐にわたり傾向が掴みにくい」状態を解消したい 1. 概要 → 因子分析 → クラスタリング
©BrainPad Inc. Strictly Confidential クラスタリング
©BrainPad Inc. Strictly Confidential 10 • クラスタリング:データをいくつかのグループ(クラスター)に分類する手法 データ同士の類似度に基づいて分類するので、正解データを使わない • 特徴:k-means法のように、事前にグループ数を決める手法もある
2. クラスタリング クラスター 3種で分類
©BrainPad Inc. Strictly Confidential 11 • 階層的クラスタリング • クラスター数を事前に決めなくて良い→多様な解釈が可能 2.
クラスタリング 2つのクラスターとして解釈できる
©BrainPad Inc. Strictly Confidential 12 • 階層的クラスタリング • クラスター数を事前に決めなくて良い→多様な解釈が可能 2.
クラスタリング 4つのクラスターとして解釈できる
©BrainPad Inc. Strictly Confidential 13 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング
Appendix
©BrainPad Inc. Strictly Confidential 14 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング
Appendix ax1 ax2 fig 描画するための 枠を作る 散布図を作る A~Fを プロットする 上記で決めた 描き方の通りに 描画する
©BrainPad Inc. Strictly Confidential 15 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング
Appendix ax1 ax2 fig 結合され方を計算 結合され方で決めた通りに A~Fのラベルや図を 対応させる 上記で決めた描き方通りに 描画する
©BrainPad Inc. Strictly Confidential 17 • アンケートデータの説明 2. クラスタリング ・
・ ・
©BrainPad Inc. Strictly Confidential 18 • クラスタリングの様子 • 距離を定義し、距離が近いところから順に結合 2.
クラスタリング オレンジ:退会する人が多め 緑:退会する人は少なめ 結果→
©BrainPad Inc. Strictly Confidential 19 • クラスタリング結果の解釈 2. クラスタリング オレンジ:退会する人が多め
緑:退会する人は少なめ オレンジグループ(貢献度,操作性に低い点をつける人)が 退会する傾向にあると推察された →「業務に貢献できていない」「直感的に操作できない」 と感じる人が退会しがちだと考えられる
©BrainPad Inc. Strictly Confidential 20 • クラスタリング結果の解釈 → 「なぜ?」という要因の分析へ 2.
クラスタリング オレンジ:退会する人が多め 緑:退会する人は少なめ オレンジグループ(貢献度,操作性に低い点をつける人)が 退会する傾向にあると推察された →「業務に貢献できていない」「直感的に操作できない」 と感じる人が退会しがちだと考えられる なぜ「業務に貢献できていない」「直感的に操作できない」 と感じてしまうのか? そう思わせるのは何が原因なのか? → 因子分析を行うことにした 何か 不満
©BrainPad Inc. Strictly Confidential 因子分析
©BrainPad Inc. Strictly Confidential 22 • 因子分析 • 観測できる値(観測変数)は、どの因子(潜在変数)から影響を受けているか? 3.
因子分析 国語の点数 理科の点数 体育の点数 社会の点数 数学の点数 目に見える データ 要因 目に見えない データ 潜在変数 観測変数
©BrainPad Inc. Strictly Confidential 23 • 因子分析 • 観測できる値(観測変数)は、どの因子(潜在変数)から影響を受けているか? 3.
因子分析 文系の能力 理系の能力 国語の点数 理科の点数 体育の点数 社会の点数 数学の点数 目に見える データ 目に見えない データ 潜在変数 観測変数
©BrainPad Inc. Strictly Confidential 24 • 因子分析をビジネスにどう活かすか? • どんな因子(潜在変数)が考えられるかを、観測できる値(アンケートの回答)から探る 3.
因子分析 〇〇が良い △△がある 1問目の回答 4問目の回答 5問目の回答 2問目の回答 3問目の回答 アンケートの 回答 ユーザー心理 潜在変数 観測変数
©BrainPad Inc. Strictly Confidential 25 • アンケートデータの説明 3. 因子分析 本サービスは貴社の業務に貢献していますか?
マニュアルなしでも直感的に操作できますか? サポートの対応に満足していますか? サービスの価格は適切ですか? コンテンツの更新頻度は適切ですか? 掲載されている情報の信頼性は高いですか?
©BrainPad Inc. Strictly Confidential 26 • アンケートデータを用いて 因子分析を実施してみる 3. 因子分析
標準化 行列計算
©BrainPad Inc. Strictly Confidential 27 • 因子分析 Pythonで書くには? 3. 因子分析
Appendix
©BrainPad Inc. Strictly Confidential 28 • 因子分析 Pythonで書くには? 3. 因子分析
Appendix 2因子のモデルで因子分析を行うモデルを作成する varimax(行列の分散が最大になるような直行回転)を用いて計算する 先程のdataをこのモデルに入れる fa.loadings_で因子負荷行列を計算・出力する この因子負荷行列をDataFrameに入れて表示する
©BrainPad Inc. Strictly Confidential 29 • 因子分析 3. 因子分析 因子1
因子2 貢献度 操作性 安い 信頼性 サポート 更新頻度 グラフネットワークで 因子と観測変数を表現できた 因子1,2が どこの値に大きく表れるか わかった
©BrainPad Inc. Strictly Confidential 30 • 因子1, 因子2って何? 3. 因子分析
まとめ:因子解釈の例 因子1:情報の価値、情報の品質 因子2:使いやすさ、サービスの品質、UX 因子1 因子2 貢献度 更新頻度 信頼性 操作性 サポート 安い 因子1 因子2 貢献度 操作性 安い 信頼性 サポート 更新頻度 このままだと因子1,2が 何を示しているのか わかりづらい 情報価値 使いやすさ
©BrainPad Inc. Strictly Confidential 4. おわりに
©BrainPad Inc. Strictly Confidential 32 クラスター分析、因子分析の 内容を踏まえて…
©BrainPad Inc. Strictly Confidential 33 • クラスター分析、因子分析の結果を総合して考えると? 4. おわりに 結論:
会員番号0,1,3の3名は貢献度や操作性に満足できていない? 今後は情報の価値や使いやすさを中心に向上を図るなどして改善できるのでは?
©BrainPad Inc. Strictly Confidential 34 まとめ • 階層的クラスタリングで退会する人しない人の傾向を掴めた • 因子分析でなぜ退会するのか、要因の推定・解釈ができた
今後の展望 統計的な観点から • 他の属性や他の解釈も行うことで、新しい因子を発見できないか検討する(LLM併用など) 4. おわりに
©BrainPad Inc. Strictly Confidential 35 今後の展望 データエンジニアリング的な観点から • 他の属性も扱うには、どのようにデータを整備すべきか? •
→ アンケートデータ、人事データのように 担当者が使いやすいようにデータを分けておく 4. おわりに 人事データとアンケートデータが混在 表記ゆれが多い 合計のような計算結果はいらない 取り出してすぐ使える!
株式会社ブレインパッド 106-0032 東京都港区六本木三丁目1番1号 六本木ティーキューブ TEL:03-6721-7002 FAX:03-6721-7010 www.brainpad.co.jp
[email protected]
本資料は、未刊行文書として日本及び各国の著作権法に基づき保護されております。本資料には、株式会社ブレインパッド所有の特定情報が含まれており、これら情報に基づく本資料の内容は、貴社以外の第三者に開示されること、また、本資料を評価する以外の目的で、その 一部または全文を複製、使用、公開することは、禁止されています。また、株式会社ブレインパッドによる書面での許可なく、それら情報の一部または全文を使用または公開することは、いかなる場合も禁じられております。
©BrainPad Inc.