$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多変量解析
Search
katsutan
March 23, 2017
Technology
0
120
多変量解析
長岡技術科学大学 自然言語処理研究室 B3ゼミ発表8
katsutan
March 23, 2017
Tweet
Share
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
230
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
210
Simple task-specific bilingual word embeddings
katsutan
0
210
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
260
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
200
Improving Word Embeddings Using Kernel PCA
katsutan
0
220
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
320
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
260
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
290
Other Decks in Technology
See All in Technology
学習データって増やせばいいんですか?
ftakahashi
2
340
Snowflakeでデータ基盤を もう一度作り直すなら / rebuilding-data-platform-with-snowflake
pei0804
6
1.6k
モダンデータスタック (MDS) の話とデータ分析が起こすビジネス変革
sutotakeshi
0
500
SSO方式とJumpアカウント方式の比較と設計方針
yuobayashi
7
690
AI駆動開発における設計思想 認知負荷を下げるフロントエンドアーキテクチャ/ 20251211 Teppei Hanai
shift_evolve
PRO
2
400
Kubernetes Multi-tenancy: Principles and Practices for Large Scale Internal Platforms
hhiroshell
0
120
チーリンについて
hirotomotaguchi
6
2k
因果AIへの招待
sshimizu2006
0
980
RAG/Agent開発のアップデートまとめ
taka0709
0
180
MLflowで始めるプロンプト管理、評価、最適化
databricksjapan
1
250
AIプラットフォームにおけるMLflowの利用について
lycorptech_jp
PRO
1
160
AI-DLCを現場にインストールしてみた:プロトタイプ開発で分かったこと・やめたこと
recruitengineers
PRO
2
140
Featured
See All Featured
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
390
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
54k
Code Reviewing Like a Champion
maltzj
527
40k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
970
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.3k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
Practical Orchestrator
shlominoach
190
11k
Designing for humans not robots
tammielis
254
26k
The World Runs on Bad Software
bkeepers
PRO
72
12k
Testing 201, or: Great Expectations
jmmastey
46
7.8k
Raft: Consensus for Rubyists
vanstee
141
7.2k
A better future with KSS
kneath
240
18k
Transcript
多変量解析 長岡技術科学大学 自然言語処理研究室 学部3年 勝田 哲弘 1 2017/3/23
多変量解析とは • 変量(変数) ▫ 資料の項目 • 多変量解析 ▫ 複数の項目で構成された資料の分析 2
多変量資料 個体名 w ・・・ z 1 2 ・ ・ ・
n 3 個 体 変量 • 加工されていない生のデータを個票、個票デー タ、1次データという。
パス図 • 変量の関係を示す図。 4 婚姻率 人口 旅券発行率 誤差 2 相
関 影響
潜在変数 • 直接観測できない隠れた変数 5 理科 数学 国語 英語 社会 eu
ey ex ev ew 理系能力 文系能力
分析 • 回帰分析 ▫ 変量を式で表す • 主成分分析 ▫ 分散が最大となる新変量を合成 •
因子分析 ▫ データから原因を見つける ▫ SEM(structural equation models) • 判別分析 ▫ 別れ方を調べる 6
主成分分析 • データの見方を変える • 合成変量 = + + (2 +
2 + 2 = 1) 3変量, , 、各変量の重み, , 7 p p
主成分 = + + ( = 1,2, … , )
• 合成変量の分散が最大の時 ▫ 主成分 ▫ 主成分負荷量 , , • 分散 2 2 = 1 (1 − )2+(2 − )2+ ⋯ + ( − )2 8
寄与率 • 寄与率C 0 ≤ ≤ 1 寄与率 = 主成分の分散
各変量の分散の和 = 2 2 + 2 + 2 9
第2主成分 • 最初に抽出した第1主成分の残りから主成分を 抽出する = + + 第1主成分を取り除いた変量′, ′, ′
′ = ′′ + ′′ + ′′ (′2 + ′2 + ′2 = 1) • 寄与率 寄与率′ = ′ 2 2 + 2 + 2 10
プロット • 変量プロット ▫ 主成分から評価 , ′ , ′ ,
′ • 主成分得点プロット ▫ 各個体の特長を主成分の観点から解釈 , ′ 11
ラグランジュの未定係数法 最大の を求める = + + (2 + 2 +
2 = 1) 変量を5(x,y,u,v,w)とした場合 = 1 (1 − )2+ ⋯ + − 2 −(2 + 2 + ⋯ + 2 − 1) = 0, = 0, = 0, = 0, = 0 12
ラグランジュの未定係数法 = 2 2 + + + + − 2
= 0 2 2 2 2 2 = 固有値問題に帰着する 13
参考文献 • First Book 多変量解析がわかる 涌井貞美 涌井良幸 著 技術評論社 14