Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DTD_はじめての因子分析_理論とビジネス活用.pdf
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
BrainPad
December 18, 2025
Technology
2.5k
2
Share
DTD_はじめての因子分析_理論とビジネス活用.pdf
BrainPad
December 18, 2025
More Decks by BrainPad
See All by BrainPad
BrainPad AAA_AIエージェントの社会実装する上での壁 / Barriers to the Social Implementation of AI Agents
brainpadpr
1
160
白金鉱業Meetup_Vol.22_Orbital Senseを支える衛星画像のマルチモーダルエンベディングと地理空間のあいまい検索技術
brainpadpr
3
370
DTD_AIエージェント開発プロジェクトのメソッドを体系化してみる
brainpadpr
1
310
DTD_Databricksことはじめ
brainpadpr
0
250
【採用候補者向け】BrainPad AAAご紹介資料
brainpadpr
0
1.8k
DTD_TensorRTを用いた自然言語処理モデルの高速化
brainpadpr
0
100
DTD_生成AIアシスタントのコスト最適化
brainpadpr
1
210
白金鉱業Vol.21【初学者向け発表枠】身近な例から学ぶ数理最適化の基礎 / Learning the Basics of Mathematical Optimization Through Everyday Examples
brainpadpr
1
710
三田データ_BrainPadAAA_AIエージェント元年を振り返る
brainpadpr
1
230
Other Decks in Technology
See All in Technology
Oracle Cloud Infrastructure:2026年4月度サービス・アップデート
oracle4engineer
PRO
0
200
Practical TypeProf: Lessons from Analyzing Optcarrot
mame
1
1.4k
「責任あるAIエージェント」こそ自社で開発しよう!
minorun365
10
2.6k
Agents CLI と Gemini Enterprise Agent Platform で マルチエージェント開発が楽しくなる!
kaz1437
0
190
AIが書いたコードを信じられない問題 〜レビュー負荷を下げるために変えたこと〜 / The AI Code Trust Gap: Reducing the Review Burden
bitkey
PRO
8
1.4k
『生成AI時代のクレデンシャルとパーミッション設計 — Claude Code を起点に』の執筆企画
takuros
1
1.5k
Do Vibe Coding ao LLM em Produção para Busca Agêntica - TDC 2026 - Summit IA - São Paulo
jpbonson
3
160
No Types Needed, Just Callable Method Check
dak2
1
2.5k
260422_Sansan_Tech_Talk__関西_vol.3_データ活用のリアル__矢田__.pdf
sansantech
PRO
0
140
AI時代における技術的負債への取り組み
codenote
1
1.9k
Building Production-Ready Agents Microsoft Agent Framework
_mertmetin
0
110
AIが自律的に働く時代へ Amazon Quick で実現するAIエージェント紹介
koheiyoshikawa
0
150
Featured
See All Featured
How to Think Like a Performance Engineer
csswizardry
28
2.6k
WENDY [Excerpt]
tessaabrams
10
37k
Building an army of robots
kneath
306
46k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.4k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
270
Designing Experiences People Love
moore
143
24k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
270
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
120
Into the Great Unknown - MozCon
thekraken
41
2.4k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
10k
Transcript
はじめての因子分析 理論とビジネス活用 2025年 12月18日
©BrainPad Inc. Strictly Confidential 2 自己紹介 ・経歴: ・ 2013年 医療機器の会社に勤務
・ 2021年 フリーランスのDSとして活動 ・ 2025年 株式会社ブレインパッド 入社 ・プロジェクト経験: ・小売業でのデータ分析基盤の構築 ・統計関連の案件 ・趣味: ・統計学の勉強 ・ボードゲーム ・子供と遊ぶ
©BrainPad Inc. Strictly Confidential 3 自己紹介 • 今回は統計学のお話になります • 統計学で最近勉強した因子分析関連の話に焦点を置いて話します
• 理論の部分は数式が難しいので、流れなどを中心に説明できればと思います
1. 概要 2. クラスタリング 3. 因子分析 4. おわりに
©BrainPad Inc. Strictly Confidential 5 因子分析 1. どんなものか? たくさんのデータの背後にある「共通の要因(=因子)」を推定する統計手法です ※詳しくは後述します
2. どういう時に使えそうか? 教育:生徒の能力にあたる因子を推定 (例:計算が早い、運動が苦手) マーケティング:購買動機にあたる因子を推定 (例:持ち運びやすい、デザインが良い) →次に具体例で考えてみましょう 1. 概要
©BrainPad Inc. Strictly Confidential 6 • アンケートデータの分析について考えてみます 1. 背景: ・技術者向けの会員制サービスを作っている
・この会員の退会率が課題となっており、直接的な要因もはっきりしなかった 2. 実施内容: ・要因を推定するためにユーザー向けアンケートを実施した ・機能性、コストなどの中で「どれが退会の引き金になっているか?」を推定する 1. 概要 → 設定した例 概ね 満足 何か 不満
©BrainPad Inc. Strictly Confidential 7 • アンケート分析の狙いと手法 • ①どんな回答をした人が退会する? •
②退会の決め手となる要因は何か? • アンケート結果と退会の関連性を見たい • 「項目が多岐にわたり傾向が掴みにくい」状態を解消したい 1. 概要 概ね 満足 何か 不満
©BrainPad Inc. Strictly Confidential 8 • アンケート分析の狙いと手法 • ①どんな回答をした人が退会する? •
②退会の決め手となる要因は何か? • アンケート結果と退会の関連性を見たい • 「項目が多岐にわたり傾向が掴みにくい」状態を解消したい 1. 概要 → 因子分析 → クラスタリング
©BrainPad Inc. Strictly Confidential クラスタリング
©BrainPad Inc. Strictly Confidential 10 • クラスタリング:データをいくつかのグループ(クラスター)に分類する手法 データ同士の類似度に基づいて分類するので、正解データを使わない • 特徴:k-means法のように、事前にグループ数を決める手法もある
2. クラスタリング クラスター 3種で分類
©BrainPad Inc. Strictly Confidential 11 • 階層的クラスタリング • クラスター数を事前に決めなくて良い→多様な解釈が可能 2.
クラスタリング 2つのクラスターとして解釈できる
©BrainPad Inc. Strictly Confidential 12 • 階層的クラスタリング • クラスター数を事前に決めなくて良い→多様な解釈が可能 2.
クラスタリング 4つのクラスターとして解釈できる
©BrainPad Inc. Strictly Confidential 13 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング
Appendix
©BrainPad Inc. Strictly Confidential 14 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング
Appendix ax1 ax2 fig 描画するための 枠を作る 散布図を作る A~Fを プロットする 上記で決めた 描き方の通りに 描画する
©BrainPad Inc. Strictly Confidential 15 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング
Appendix ax1 ax2 fig 結合され方を計算 結合され方で決めた通りに A~Fのラベルや図を 対応させる 上記で決めた描き方通りに 描画する
©BrainPad Inc. Strictly Confidential 17 • アンケートデータの説明 2. クラスタリング ・
・ ・
©BrainPad Inc. Strictly Confidential 18 • クラスタリングの様子 • 距離を定義し、距離が近いところから順に結合 2.
クラスタリング オレンジ:退会する人が多め 緑:退会する人は少なめ 結果→
©BrainPad Inc. Strictly Confidential 19 • クラスタリング結果の解釈 2. クラスタリング オレンジ:退会する人が多め
緑:退会する人は少なめ オレンジグループ(貢献度,操作性に低い点をつける人)が 退会する傾向にあると推察された →「業務に貢献できていない」「直感的に操作できない」 と感じる人が退会しがちだと考えられる
©BrainPad Inc. Strictly Confidential 20 • クラスタリング結果の解釈 → 「なぜ?」という要因の分析へ 2.
クラスタリング オレンジ:退会する人が多め 緑:退会する人は少なめ オレンジグループ(貢献度,操作性に低い点をつける人)が 退会する傾向にあると推察された →「業務に貢献できていない」「直感的に操作できない」 と感じる人が退会しがちだと考えられる なぜ「業務に貢献できていない」「直感的に操作できない」 と感じてしまうのか? そう思わせるのは何が原因なのか? → 因子分析を行うことにした 何か 不満
©BrainPad Inc. Strictly Confidential 因子分析
©BrainPad Inc. Strictly Confidential 22 • 因子分析 • 観測できる値(観測変数)は、どの因子(潜在変数)から影響を受けているか? 3.
因子分析 国語の点数 理科の点数 体育の点数 社会の点数 数学の点数 目に見える データ 要因 目に見えない データ 潜在変数 観測変数
©BrainPad Inc. Strictly Confidential 23 • 因子分析 • 観測できる値(観測変数)は、どの因子(潜在変数)から影響を受けているか? 3.
因子分析 文系の能力 理系の能力 国語の点数 理科の点数 体育の点数 社会の点数 数学の点数 目に見える データ 目に見えない データ 潜在変数 観測変数
©BrainPad Inc. Strictly Confidential 24 • 因子分析をビジネスにどう活かすか? • どんな因子(潜在変数)が考えられるかを、観測できる値(アンケートの回答)から探る 3.
因子分析 〇〇が良い △△がある 1問目の回答 4問目の回答 5問目の回答 2問目の回答 3問目の回答 アンケートの 回答 ユーザー心理 潜在変数 観測変数
©BrainPad Inc. Strictly Confidential 25 • アンケートデータの説明 3. 因子分析 本サービスは貴社の業務に貢献していますか?
マニュアルなしでも直感的に操作できますか? サポートの対応に満足していますか? サービスの価格は適切ですか? コンテンツの更新頻度は適切ですか? 掲載されている情報の信頼性は高いですか?
©BrainPad Inc. Strictly Confidential 26 • アンケートデータを用いて 因子分析を実施してみる 3. 因子分析
標準化 行列計算
©BrainPad Inc. Strictly Confidential 27 • 因子分析 Pythonで書くには? 3. 因子分析
Appendix
©BrainPad Inc. Strictly Confidential 28 • 因子分析 Pythonで書くには? 3. 因子分析
Appendix 2因子のモデルで因子分析を行うモデルを作成する varimax(行列の分散が最大になるような直行回転)を用いて計算する 先程のdataをこのモデルに入れる fa.loadings_で因子負荷行列を計算・出力する この因子負荷行列をDataFrameに入れて表示する
©BrainPad Inc. Strictly Confidential 29 • 因子分析 3. 因子分析 因子1
因子2 貢献度 操作性 安い 信頼性 サポート 更新頻度 グラフネットワークで 因子と観測変数を表現できた 因子1,2が どこの値に大きく表れるか わかった
©BrainPad Inc. Strictly Confidential 30 • 因子1, 因子2って何? 3. 因子分析
まとめ:因子解釈の例 因子1:情報の価値、情報の品質 因子2:使いやすさ、サービスの品質、UX 因子1 因子2 貢献度 更新頻度 信頼性 操作性 サポート 安い 因子1 因子2 貢献度 操作性 安い 信頼性 サポート 更新頻度 このままだと因子1,2が 何を示しているのか わかりづらい 情報価値 使いやすさ
©BrainPad Inc. Strictly Confidential 4. おわりに
©BrainPad Inc. Strictly Confidential 32 クラスター分析、因子分析の 内容を踏まえて…
©BrainPad Inc. Strictly Confidential 33 • クラスター分析、因子分析の結果を総合して考えると? 4. おわりに 結論:
会員番号0,1,3の3名は貢献度や操作性に満足できていない? 今後は情報の価値や使いやすさを中心に向上を図るなどして改善できるのでは?
©BrainPad Inc. Strictly Confidential 34 まとめ • 階層的クラスタリングで退会する人しない人の傾向を掴めた • 因子分析でなぜ退会するのか、要因の推定・解釈ができた
今後の展望 統計的な観点から • 他の属性や他の解釈も行うことで、新しい因子を発見できないか検討する(LLM併用など) 4. おわりに
©BrainPad Inc. Strictly Confidential 35 今後の展望 データエンジニアリング的な観点から • 他の属性も扱うには、どのようにデータを整備すべきか? •
→ アンケートデータ、人事データのように 担当者が使いやすいようにデータを分けておく 4. おわりに 人事データとアンケートデータが混在 表記ゆれが多い 合計のような計算結果はいらない 取り出してすぐ使える!
株式会社ブレインパッド 106-0032 東京都港区六本木三丁目1番1号 六本木ティーキューブ TEL:03-6721-7002 FAX:03-6721-7010 www.brainpad.co.jp
[email protected]
本資料は、未刊行文書として日本及び各国の著作権法に基づき保護されております。本資料には、株式会社ブレインパッド所有の特定情報が含まれており、これら情報に基づく本資料の内容は、貴社以外の第三者に開示されること、また、本資料を評価する以外の目的で、その 一部または全文を複製、使用、公開することは、禁止されています。また、株式会社ブレインパッドによる書面での許可なく、それら情報の一部または全文を使用または公開することは、いかなる場合も禁じられております。
©BrainPad Inc.