Modern Techniques for Dimensional Reduction

D A T A S C I E N C
E Modern Techniques for Dimensional Reduction 1 Copyright © ASI 2017 All rights reserved Machine Learning Tech Sessions 7th December 2017 Ilya Feige Head of ML Research

Artificial Intelligence for everyone 3 Copyright © ASI 2017 All
rights reserved

Copyright © ASI 2017 All rights reserved Outline 5 1.
Dimensional reduction motivation 2. PCA reminder 3. T-SNE is amazing! 5

Copyright © ASI 2017 All rights reserved Dimensional Reduction 6
The process of reducing the number of variables (features) under consideration in a statistical / machine learning analysis

Copyright © ASI 2017 All rights reserved Why is it
needed? 7 • Nowadays data is very high dimensional • Many features are highly correlated • Manual feature selection is often impossible • Visualising data requires 2D representations • Most models break down in high dimensions! 1-D Data occupies ⇠ ✓ 1 10 ◆2 of space Data occupies ⇠ ✓ 1 10 ◆n of space Data occupies ⇠ 1 10 of space 2-D n-D Curse of dimensionality

Copyright © ASI 2017 All rights reserved Principal Component Analysis
(PCA) 9 Idea: Find basis that better expresses data How: Eigenvalue decomposition (or SVD) What for: Can then throw away directions of low variance • Rotate to uncorrelated coordinates • Project onto largest variance axes Dimensional reduction with PCA:

Copyright © ASI 2017 All rights reserved 10 MNIST is
a dataset images of handwritten digits

Copyright © ASI 2017 All rights reserved 11 PCA on
MNIST does not separate digits

Copyright © ASI 2017 All rights reserved 12 T-SNE is
amazing!

Copyright © ASI 2017 All rights reserved Definition of t-SNE
13 “t-distributed stochastic neighbour embedding” Step 1: Construct a distribution in the high- dimensional space based on pair-wise distance Step 2: Construct a similar distribution (but with wider tails) in the low-dimensional space Step 3: Make the two distributions as similar as possible by minimising their KL divergence pj|i = exp ||xi xj ||2/2 2 i P k6=i exp ||xi xk ||2/2 2 i pij = 1 2N pi|j + pj|i qij = 1 + ||yi yj ||2 1 P k6=` 1 + ||yk y` ||2 1 {y⇤ i } = argmin yi n KL P||Q o = argmin yi ⇢ X j6=k pjk log pjk qjk 1 2 3

Modern Techniques for Dimensional Reduction

Modern Techniques for Dimensional Reduction

techsessions

More Decks by techsessions

Other Decks in Technology

Featured

Transcript

D A T A S C I E N C

Copyright © ASI 2017 All rights reserved • Head of

Artificial Intelligence for everyone 3 Copyright © ASI 2017 All

Copyright © ASI 2017 All rights reserved About ASI Data

Copyright © ASI 2017 All rights reserved Outline 5 1.

Copyright © ASI 2017 All rights reserved Dimensional Reduction 6

Copyright © ASI 2017 All rights reserved Why is it

Copyright © ASI 2017 All rights reserved PCA Reminder 8

Copyright © ASI 2017 All rights reserved Principal Component Analysis

Copyright © ASI 2017 All rights reserved 10 MNIST is

Copyright © ASI 2017 All rights reserved 11 PCA on

Copyright © ASI 2017 All rights reserved 12 T-SNE is

Copyright © ASI 2017 All rights reserved Definition of t-SNE

Copyright © ASI 2017 All rights reserved 14 t-SNE is

Copyright © ASI 2017 All rights reserved Q & A

Copyright © ASI 2017 All rights reserved 16 PCA effectively

Copyright © ASI 2017 All rights reserved 18 PCA vs