Slide 1

Slide 1 text

Algoritmo UMAP Reducción de dimensionalidad UNIVERSIDAD RICARDO PALMA Maestría en Ciencia de los Datos Curso: Técnicas Multivariantes aplicado en los Negocios. Arnaldo Ramirez F. [email protected] Gonzalo Chacaltana B. [email protected]

Slide 2

Slide 2 text

¿Qué es UMAP? ● Uniform Manifold Approximation and Projection ● Algoritmo escalable para la reducción de dimensiones de propósito general para el aprendizaje automático. ● Desarrollado por el matemático inglés Leland McInnes (2018). ● Se construye a partir de un marco teórico basado en la Geometría Riemanniana y la topología algebraica. ● Novedosa técnica de aprendizaje múltiple para la reducción de dimensiones que utiliza el Descenso de Gradiente Estocástico. ● El algoritmo UMAP es competitivo con t-SNE en cuanto a calidad de visualización, y podría decirse que conserva una mayor parte de la estructura global con un rendimiento superior en tiempo de ejecución. Leland McInnes en la conferencia Machine Learning Prague 2019.

Slide 3

Slide 3 text

¿Cómo funciona UMAP? Para comprender cómo funciona el algoritmo UMAP, se requiere un poco de conocimientos matemáticos de topología algebraica, análisis de datos topológicos, matemática profunda y lógica difusa. ● Building Block Simplex: Geométricamente, un simplex es una forma muy simple de construir un objeto k-dimensional. Punto Línea Triángulo Tetraedro Puede considerar un k-simplex como un conjunto arbitrario de k + 1 objetos con caras (y caras de caras, etc.) dadas por subconjuntos de tamaño apropiado. La unión de los Block Simplex formarían los espacios topológicos (simplexis complex). Simplexis Complex

Slide 4

Slide 4 text

UMAP - Hiperparámetros

Slide 5

Slide 5 text

Demo UMAP

Slide 6

Slide 6 text

Referencias ● Cornell University, UMAP Paper, enlace https://arxiv.org/abs/1802.03426 ● Moreno J. (2020) Tesis: “Clustering de recetas culinarias generadas por Giuseppe”, enlace http://repositorio.uchile.cl/bitstream/handle/2250/176767/Clustering-de-recetas-culinarias-generadas-por-Giuseppe.pdf ● R Project, UMAP Package, enlace https://cran.r-project.org/web/packages/umap/umap.pdf