Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多変量解析
Search
katsutan
March 23, 2017
Technology
0
120
多変量解析
長岡技術科学大学 自然言語処理研究室 B3ゼミ発表8
katsutan
March 23, 2017
Tweet
Share
More Decks by katsutan
See All by katsutan
What does BERT learn about the structure of language?
katsutan
0
180
Simple and Effective Paraphrastic Similarity from Parallel Translations
katsutan
0
160
Simple task-specific bilingual word embeddings
katsutan
0
180
Retrofitting Contextualized Word Embeddings with Paraphrases
katsutan
0
210
Character Eyes: Seeing Language through Character-Level Taggers
katsutan
1
160
Improving Word Embeddings Using Kernel PCA
katsutan
0
180
Better Word Embeddings by Disentangling Contextual n-Gram Information
katsutan
0
250
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications
katsutan
0
230
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings
katsutan
0
250
Other Decks in Technology
See All in Technology
初心者向けAWS Securityの勉強会mini Security-JAWSを9ヶ月ぐらい実施してきての近況
cmusudakeisuke
0
130
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
oracle4engineer
PRO
2
3.2k
アジャイルチームがらしさを発揮するための目標づくり / Making the goal and enabling the team
kakehashi
3
140
AGIについてChatGPTに聞いてみた
blueb
0
130
The Role of Developer Relations in AI Product Success.
giftojabu1
0
130
10XにおけるData Contractの導入について: Data Contract事例共有会
10xinc
6
660
rootlessコンテナのすゝめ - 研究室サーバーでもできる安全なコンテナ管理
kitsuya0828
3
390
サイバーセキュリティと認知バイアス:対策の隙を埋める心理学的アプローチ
shumei_ito
0
390
Python(PYNQ)がテーマのAMD主催のFPGAコンテストに参加してきた
iotengineer22
0
500
ドメインの本質を掴む / Get the essence of the domain
sinsoku
2
160
ノーコードデータ分析ツールで体験する時系列データ分析超入門
negi111111
0
420
複雑なState管理からの脱却
sansantech
PRO
1
150
Featured
See All Featured
KATA
mclloyd
29
14k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
26
1.4k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
93
16k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
506
140k
GitHub's CSS Performance
jonrohan
1030
460k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
420
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
4
370
Bash Introduction
62gerente
608
210k
How to Think Like a Performance Engineer
csswizardry
20
1.1k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
191
16k
Transcript
多変量解析 長岡技術科学大学 自然言語処理研究室 学部3年 勝田 哲弘 1 2017/3/23
多変量解析とは • 変量(変数) ▫ 資料の項目 • 多変量解析 ▫ 複数の項目で構成された資料の分析 2
多変量資料 個体名 w ・・・ z 1 2 ・ ・ ・
n 3 個 体 変量 • 加工されていない生のデータを個票、個票デー タ、1次データという。
パス図 • 変量の関係を示す図。 4 婚姻率 人口 旅券発行率 誤差 2 相
関 影響
潜在変数 • 直接観測できない隠れた変数 5 理科 数学 国語 英語 社会 eu
ey ex ev ew 理系能力 文系能力
分析 • 回帰分析 ▫ 変量を式で表す • 主成分分析 ▫ 分散が最大となる新変量を合成 •
因子分析 ▫ データから原因を見つける ▫ SEM(structural equation models) • 判別分析 ▫ 別れ方を調べる 6
主成分分析 • データの見方を変える • 合成変量 = + + (2 +
2 + 2 = 1) 3変量, , 、各変量の重み, , 7 p p
主成分 = + + ( = 1,2, … , )
• 合成変量の分散が最大の時 ▫ 主成分 ▫ 主成分負荷量 , , • 分散 2 2 = 1 (1 − )2+(2 − )2+ ⋯ + ( − )2 8
寄与率 • 寄与率C 0 ≤ ≤ 1 寄与率 = 主成分の分散
各変量の分散の和 = 2 2 + 2 + 2 9
第2主成分 • 最初に抽出した第1主成分の残りから主成分を 抽出する = + + 第1主成分を取り除いた変量′, ′, ′
′ = ′′ + ′′ + ′′ (′2 + ′2 + ′2 = 1) • 寄与率 寄与率′ = ′ 2 2 + 2 + 2 10
プロット • 変量プロット ▫ 主成分から評価 , ′ , ′ ,
′ • 主成分得点プロット ▫ 各個体の特長を主成分の観点から解釈 , ′ 11
ラグランジュの未定係数法 最大の を求める = + + (2 + 2 +
2 = 1) 変量を5(x,y,u,v,w)とした場合 = 1 (1 − )2+ ⋯ + − 2 −(2 + 2 + ⋯ + 2 − 1) = 0, = 0, = 0, = 0, = 0 12
ラグランジュの未定係数法 = 2 2 + + + + − 2
= 0 2 2 2 2 2 = 固有値問題に帰着する 13
参考文献 • First Book 多変量解析がわかる 涌井貞美 涌井良幸 著 技術評論社 14