Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多次元尺度法MDS
Search
Ringa_hyj
January 07, 2021
Science
0
260
多次元尺度法MDS
Ringa_hyj
January 07, 2021
Tweet
Share
More Decks by Ringa_hyj
See All by Ringa_hyj
DVCによるデータバージョン管理
ringa_hyj
0
27
deeplakeによる大規模データのバージョン管理と深層学習フレームワークとの接続
ringa_hyj
0
22
Hydraを使った設定ファイル管理とoptunaプラグインでのパラメータ探索
ringa_hyj
0
34
ClearMLで行うAIプロジェクトの管理(レポート,最適化,再現,デプロイ,オーケストレーション)
ringa_hyj
0
23
Catching up with the tidymodels.[Japan.R 2021 LT]
ringa_hyj
3
810
因子分析(仮)
ringa_hyj
0
130
階層、非階層クラスタリング
ringa_hyj
0
98
tidymodels紹介「モデリング過程料理で表現できる説」
ringa_hyj
0
400
深層学習をつかった画像スタイル変換の話と今までの歴史
ringa_hyj
0
390
Other Decks in Science
See All in Science
Snowflakeによる統合バイオインフォマティクス
ktatsuya
0
610
Iniciativas independentes de divulgação científica: o caso do Movimento #CiteMulheresNegras
taisso
0
980
WeMeet Group - 採用資料
wemeet
0
4.4k
Visual Analytics for R&D Intelligence @Funding the Commons & DeSci Tokyo 2024
hayataka88
0
140
All-in-One Bioinformatics Platform Realized with Snowflake ~ From In Silico Drug Discovery, Disease Variant Analysis, to Single-Cell RNA-seq
ktatsuya
0
310
理論計算機科学における 数学の応用: 擬似ランダムネス
nobushimi
1
400
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
130
いまAI組織が求める企画開発エンジニアとは?
roadroller
2
1.4k
Machine Learning for Materials (Challenge)
aronwalsh
0
150
ACL読み会2024@名大 REANO: Optimising Retrieval-Augmented Reader Models through Knowledge Graph Generation
takuma_matsubara
0
150
生成AI による論文執筆サポートの手引き(ワークショップ) / A guide to supporting dissertation writing with generative AI (workshop)
ks91
PRO
0
400
応用心理学Ⅰテキストマイニング講義資料講義編(2024年度)
satocos135
0
110
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
336
57k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.6k
Fireside Chat
paigeccino
34
3.2k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
33
2.8k
Fashionably flexible responsive web design (full day workshop)
malarkey
406
66k
Fontdeck: Realign not Redesign
paulrobertlloyd
83
5.4k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Measuring & Analyzing Core Web Vitals
bluesmoon
6
250
Mobile First: as difficult as doing things right
swwweet
223
9.4k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
100
18k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
10
510
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Transcript
多次元尺度法 MDS : multi dimensional scaling 特性値ではなく、 個体間の類似性を表現するようなデータに対して行う分析 多次元の類似性を持つデータを低次元に落とすなどがMDS 類似性といっても、必ず距離データでなくともいい場合(非計量多次元尺度
non metric MDS) 距離データである場合 metric MDS (計量多次元尺度、古典的多次元尺度)
mtric MDS データ点ごとの差の二乗の平方根を考える = − = 1 − 1 2
+ ・・・ 変換後のベクトルから、以下のような式が成り立つyの存在する空間を探す − = = = − ここで、距離の公理を満たすことを前提とする δ=0 δ>=0 δij=δji ※公理を満たすデータは「メトリックである」と呼ばれる D=[δij]
単に二乗を考えてみる ⅈ 2 = − 2 = − − =
2 + 2 − 2 ⊤ 後項の内積部分を考えると、iとjの積の総和となる = 1 1 + 22 + ⋯ = 2 + 2 − 2 よって 変形して = ½ ( 2 + 2 − ⅈ 2 ) これは個体間の距離を求めるということは、内積を求めることに等しいということを表現している 内積から別座標yへの変換を考えるのが古典的手法であると先ほど説明した。
あ
個体ijの原点は、n個の重心であるとする 新しい座標ベクトル y は ⅈ 2 = − 2 =
− − よって d^2 ij = -2aij = yi T yi + yj T yj – 2yi T yj =bii + bjj -2bij =aii + ajj – 2aij (距離の公理より) =-2aij
bij = aij – mean(ai+) - mean(a+j) + mean(a++) bij
= (yi – y_bar)T(yj-y_bar) B = [bij] このとき、Bは固有値がすべて非負の半正定値行列であることがわかる B=ΓΛΓ ^T = (ΓΛ^1/2)(ΓΛ^1/2) = YY^T ΛはBの固有値を対角として持つ行列である Λ = diag(λ1…λp) Γは固有ベクトルを列変形したもの Γi = λi ^(-1/2) xi
より詳細な計算方法 データDからA=[-1/2 dij^2]を計算 bij = aij – mean(ai+)… から B=[bij]を求める
Bのうち、正の固有値 λ だけを削減次元 k個求める(寄与率を計算する場合にはすべて求める) 固有ベクトル Y = (y1~yk)を求める λi = yi T yi となるように固有ベクトルの「長さ」を調整する 個体 pi の座標が yi1 ….yip へと変換される
2 4 5 2 3 6 4 3 7 5
6 7 行平均 mean(ai+) 列平均 mean(a+i)
2次元に落とすならば固有値λから2つの固有値を選び出す。同時に固有ベクトルも2つ得られるはず。 固有ベクトルは長さ1に正規化されて出力されるものなので、 固有値の大きさに調整する yk T yk = λk より、 yi
= y’i √λi を計算する 二次元のデータをplotにつかう。 つまり、 調整した一つ目の固有ベクトルをx座標 調整した二つ目の固有ベクトルをy座標 とする
あ
心理学のような、非類似度データに対する分析 stress(目的関数) を最小にするような個体の配置を求める = ⅆ − መ 2 ⅈ 2
1 2 ※Σはj<iの時のみ実行される ※j<I ということは、下側三角行列のすべての和になる ※d_hat は dijと近くなるような座標値から定められる値 ※分子は最小二乗法に等しい Sが0になればよい推定量で、大きい(0.2)以上だと失敗とされている
あ