Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多次元尺度法MDS
Search
Ringa_hyj
January 07, 2021
Science
0
330
多次元尺度法MDS
Ringa_hyj
January 07, 2021
Tweet
Share
More Decks by Ringa_hyj
See All by Ringa_hyj
DVCによるデータバージョン管理
ringa_hyj
0
300
deeplakeによる大規模データのバージョン管理と深層学習フレームワークとの接続
ringa_hyj
0
94
Hydraを使った設定ファイル管理とoptunaプラグインでのパラメータ探索
ringa_hyj
0
200
ClearMLで行うAIプロジェクトの管理(レポート,最適化,再現,デプロイ,オーケストレーション)
ringa_hyj
0
190
Catching up with the tidymodels.[Japan.R 2021 LT]
ringa_hyj
3
860
因子分析(仮)
ringa_hyj
0
180
階層、非階層クラスタリング
ringa_hyj
0
150
tidymodels紹介「モデリング過程料理で表現できる説」
ringa_hyj
0
620
深層学習をつかった画像スタイル変換の話と今までの歴史
ringa_hyj
0
470
Other Decks in Science
See All in Science
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
PRO
1
250
【論文紹介】Is CLIP ideal? No. Can we fix it?Yes! 第65回 コンピュータビジョン勉強会@関東
shun6211
5
2.4k
NDCG is NOT All I Need
statditto
2
2.9k
蔵本モデルが解き明かす同期と相転移の秘密 〜拍手のリズムはなぜ揃うのか?〜
syotasasaki593876
1
230
AIによる科学の加速: 各領域での革新と共創の未来
masayamoriofficial
0
460
シャボン玉の虹から原子も地震も重力も見える! 〜 物理の目「干渉縞」のすごい力 〜
syotasasaki593876
1
110
HDC tutorial
michielstock
1
530
デジタルアーカイブの教育利用促進を目指したメタデータLOD基盤に関する研究 / Research on a Metadata LOD Platform for Promoting Educational Uses of Digital Archives
masao
0
180
academist Prize 4期生 研究トーク延長戦!「美は世界を救う」っていうけど、どうやって?
jimpe_hitsuwari
0
490
高校生就活へのDA導入の提案
shunyanoda
1
6.3k
KISHIMOTO Atsuo
genomethica
0
110
フィードフォワードニューラルネットワークを用いた記号入出力制御系に対する制御器設計 / Controller Design for Augmented Systems with Symbolic Inputs and Outputs Using Feedforward Neural Network
konakalab
0
100
Featured
See All Featured
How Software Deployment tools have changed in the past 20 years
geshan
0
32k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
RailsConf 2023
tenderlove
30
1.4k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
150
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
240
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
280
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
200
We Are The Robots
honzajavorek
0
200
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
290
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
980
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
Transcript
多次元尺度法 MDS : multi dimensional scaling 特性値ではなく、 個体間の類似性を表現するようなデータに対して行う分析 多次元の類似性を持つデータを低次元に落とすなどがMDS 類似性といっても、必ず距離データでなくともいい場合(非計量多次元尺度
non metric MDS) 距離データである場合 metric MDS (計量多次元尺度、古典的多次元尺度)
mtric MDS データ点ごとの差の二乗の平方根を考える = − = 1 − 1 2
+ ・・・ 変換後のベクトルから、以下のような式が成り立つyの存在する空間を探す − = = = − ここで、距離の公理を満たすことを前提とする δ=0 δ>=0 δij=δji ※公理を満たすデータは「メトリックである」と呼ばれる D=[δij]
単に二乗を考えてみる ⅈ 2 = − 2 = − − =
2 + 2 − 2 ⊤ 後項の内積部分を考えると、iとjの積の総和となる = 1 1 + 22 + ⋯ = 2 + 2 − 2 よって 変形して = ½ ( 2 + 2 − ⅈ 2 ) これは個体間の距離を求めるということは、内積を求めることに等しいということを表現している 内積から別座標yへの変換を考えるのが古典的手法であると先ほど説明した。
あ
個体ijの原点は、n個の重心であるとする 新しい座標ベクトル y は ⅈ 2 = − 2 =
− − よって d^2 ij = -2aij = yi T yi + yj T yj – 2yi T yj =bii + bjj -2bij =aii + ajj – 2aij (距離の公理より) =-2aij
bij = aij – mean(ai+) - mean(a+j) + mean(a++) bij
= (yi – y_bar)T(yj-y_bar) B = [bij] このとき、Bは固有値がすべて非負の半正定値行列であることがわかる B=ΓΛΓ ^T = (ΓΛ^1/2)(ΓΛ^1/2) = YY^T ΛはBの固有値を対角として持つ行列である Λ = diag(λ1…λp) Γは固有ベクトルを列変形したもの Γi = λi ^(-1/2) xi
より詳細な計算方法 データDからA=[-1/2 dij^2]を計算 bij = aij – mean(ai+)… から B=[bij]を求める
Bのうち、正の固有値 λ だけを削減次元 k個求める(寄与率を計算する場合にはすべて求める) 固有ベクトル Y = (y1~yk)を求める λi = yi T yi となるように固有ベクトルの「長さ」を調整する 個体 pi の座標が yi1 ….yip へと変換される
2 4 5 2 3 6 4 3 7 5
6 7 行平均 mean(ai+) 列平均 mean(a+i)
2次元に落とすならば固有値λから2つの固有値を選び出す。同時に固有ベクトルも2つ得られるはず。 固有ベクトルは長さ1に正規化されて出力されるものなので、 固有値の大きさに調整する yk T yk = λk より、 yi
= y’i √λi を計算する 二次元のデータをplotにつかう。 つまり、 調整した一つ目の固有ベクトルをx座標 調整した二つ目の固有ベクトルをy座標 とする
あ
心理学のような、非類似度データに対する分析 stress(目的関数) を最小にするような個体の配置を求める = ⅆ − መ 2 ⅈ 2
1 2 ※Σはj<iの時のみ実行される ※j<I ということは、下側三角行列のすべての和になる ※d_hat は dijと近くなるような座標値から定められる値 ※分子は最小二乗法に等しい Sが0になればよい推定量で、大きい(0.2)以上だと失敗とされている
あ