Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多次元尺度法MDS
Search
Ringa_hyj
January 07, 2021
Science
0
190
多次元尺度法MDS
Ringa_hyj
January 07, 2021
Tweet
Share
More Decks by Ringa_hyj
See All by Ringa_hyj
Catching up with the tidymodels.[Japan.R 2021 LT]
ringa_hyj
3
720
因子分析(仮)
ringa_hyj
0
95
階層、非階層クラスタリング
ringa_hyj
0
66
tidymodels紹介「モデリング過程料理で表現できる説」
ringa_hyj
0
360
深層学習をつかった画像スタイル変換の話と今までの歴史
ringa_hyj
0
330
正準相関分析(仮)
ringa_hyj
0
63
対応分析
ringa_hyj
0
92
2020-11-15-第1回-統計学勉強会
ringa_hyj
0
620
生成モデルの今までと異常検知への応用(GAN,anoGAN,ganomaly,efficient,skip))
ringa_hyj
2
2.2k
Other Decks in Science
See All in Science
2023-10-03-FOGBoston
lcolladotor
0
190
The Universe, How it works
arafkarsh
0
110
History towards Universal Neural Network Potential for Material Discovery
matlantis
0
160
文系出身でも「アルゴリズム×数学」はスッキリ理解できた!話
wakamatsu_takumu
0
220
Machine Learning for Materials (Lecture 1)
aronwalsh
1
1.5k
Machine Learning for Materials (Lecture 8)
aronwalsh
0
330
Microbiology Labs.
maleehafatima
0
140
拡散モデルの概要 −§1. 拡散モデルで使われる確率微分⽅程式について−
nearme_tech
0
110
Cross-Media Information Spaces and Architectures (CISA)
signer
PRO
3
25k
ABEMAの効果検証事例〜効果の異質性を考える〜
s1ok69oo
3
1.6k
DEIM2024 チュートリアル ~AWSで生成AIのRAGを使ったチャットボットを作ってみよう~
yamahiro
3
740
OptimizationNight~機械学習と数理最適化の融合~
hidenari
0
330
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
504
110k
Why Our Code Smells
bkeepers
PRO
331
56k
Done Done
chrislema
178
15k
Art, The Web, and Tiny UX
lynnandtonic
290
19k
How GitHub (no longer) Works
holman
305
140k
No one is an island. Learnings from fostering a developers community.
thoeni
16
2.1k
Build your cross-platform service in a week with App Engine
jlugia
226
17k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
660
120k
Debugging Ruby Performance
tmm1
70
11k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
12
1.1k
Reflections from 52 weeks, 52 projects
jeffersonlam
345
19k
Building a Modern Day E-commerce SEO Strategy
aleyda
22
6.5k
Transcript
多次元尺度法 MDS : multi dimensional scaling 特性値ではなく、 個体間の類似性を表現するようなデータに対して行う分析 多次元の類似性を持つデータを低次元に落とすなどがMDS 類似性といっても、必ず距離データでなくともいい場合(非計量多次元尺度
non metric MDS) 距離データである場合 metric MDS (計量多次元尺度、古典的多次元尺度)
mtric MDS データ点ごとの差の二乗の平方根を考える = − = 1 − 1 2
+ ・・・ 変換後のベクトルから、以下のような式が成り立つyの存在する空間を探す − = = = − ここで、距離の公理を満たすことを前提とする δ=0 δ>=0 δij=δji ※公理を満たすデータは「メトリックである」と呼ばれる D=[δij]
単に二乗を考えてみる ⅈ 2 = − 2 = − − =
2 + 2 − 2 ⊤ 後項の内積部分を考えると、iとjの積の総和となる = 1 1 + 22 + ⋯ = 2 + 2 − 2 よって 変形して = ½ ( 2 + 2 − ⅈ 2 ) これは個体間の距離を求めるということは、内積を求めることに等しいということを表現している 内積から別座標yへの変換を考えるのが古典的手法であると先ほど説明した。
あ
個体ijの原点は、n個の重心であるとする 新しい座標ベクトル y は ⅈ 2 = − 2 =
− − よって d^2 ij = -2aij = yi T yi + yj T yj – 2yi T yj =bii + bjj -2bij =aii + ajj – 2aij (距離の公理より) =-2aij
bij = aij – mean(ai+) - mean(a+j) + mean(a++) bij
= (yi – y_bar)T(yj-y_bar) B = [bij] このとき、Bは固有値がすべて非負の半正定値行列であることがわかる B=ΓΛΓ ^T = (ΓΛ^1/2)(ΓΛ^1/2) = YY^T ΛはBの固有値を対角として持つ行列である Λ = diag(λ1…λp) Γは固有ベクトルを列変形したもの Γi = λi ^(-1/2) xi
より詳細な計算方法 データDからA=[-1/2 dij^2]を計算 bij = aij – mean(ai+)… から B=[bij]を求める
Bのうち、正の固有値 λ だけを削減次元 k個求める(寄与率を計算する場合にはすべて求める) 固有ベクトル Y = (y1~yk)を求める λi = yi T yi となるように固有ベクトルの「長さ」を調整する 個体 pi の座標が yi1 ….yip へと変換される
2 4 5 2 3 6 4 3 7 5
6 7 行平均 mean(ai+) 列平均 mean(a+i)
2次元に落とすならば固有値λから2つの固有値を選び出す。同時に固有ベクトルも2つ得られるはず。 固有ベクトルは長さ1に正規化されて出力されるものなので、 固有値の大きさに調整する yk T yk = λk より、 yi
= y’i √λi を計算する 二次元のデータをplotにつかう。 つまり、 調整した一つ目の固有ベクトルをx座標 調整した二つ目の固有ベクトルをy座標 とする
あ
心理学のような、非類似度データに対する分析 stress(目的関数) を最小にするような個体の配置を求める = ⅆ − መ 2 ⅈ 2
1 2 ※Σはj<iの時のみ実行される ※j<I ということは、下側三角行列のすべての和になる ※d_hat は dijと近くなるような座標値から定められる値 ※分子は最小二乗法に等しい Sが0になればよい推定量で、大きい(0.2)以上だと失敗とされている
あ