datos con R Horas : 16 (4 hrs/clase) 2. Presentación En el panorama actual, donde la información fluye a una velocidad sin precedentes y se genera una cantidad masiva de datos cada segundo, la capacidad de extraer valor y conocimiento de esta avalancha de información se ha convertido en una habilidad no solo deseable, sino fundamental para profesionales en prácticamente cualquier sector. No importa si te encuentras en investigación científica,ingeniería, finanzas, marketing, salud, o incluso en campos aparentemente menos orientados a los datos como las artes o las humanidades; la habilidad para comprender, procesar y comunicar perspicacias derivadas de los datos te posiciona en una ventaja competitiva significativa. Este curso lo he diseñado específicamente para personas con un conocimiento básico del lenguaje de programación R , que ya conocen algunos de los conceptos más básicos de la estadística . Supondré que ya te sientes cómodo con la sintaxis básica, la creación de variables, el uso de funciones, las estructuras de datos fundamentales como vectores, matrices, e incluso, posiblemente, ya has realizado tus primeros scripts o pequeños proyectos. Reconozco que tu motivación es ir más allá de lo básico, no solo para ejecutar comandos, sino para comprender la lógica detrás de cada paso en el proceso de análisis y, lo que es más importante, para interpretar los resultados de manera crítica y utilizarlos para informar decisiones. A lo largo de este curso, explicaremos la metodología CRISP-DM (Cross-Industry Standard Process for Data Mining), un marco de trabajo ampliamente reconocido que te guiará de manera estructurada a través de las diferentes fases de un proyecto de minería de datos o ciencia de datos, desde la comprensión del negocio y los datos hasta el despliegue de los resultados. Aprender a aplicar esta metodología te permitirá abordar cualquier proyecto de análisis de datos de manera organizada y eficiente, maximizando las probabilidades de éxito. Uno de los pilares de este curso será la inmersión profunda en el Tidyverse, un ecosistema de paquetes de R diseñado para hacer que la ciencia de datos sea más sencilla, consistente y divertida. Olvídate de los enfoques fragmentados; con paquetes como dplyr para la manipulación de datos, ggplot2 para la visualización, tidyr para la limpieza y reestructuración, y readr para la importación, mi manera de usar Tidyverse te proporcionará un flujo de trabajo cohesivo y elegante que te permitirá transformar datos crudos en visualizaciones muy comunicativas con una eficiencia sorprendente. No solo te enseñaré a usar estas herramientas, sino que entenderás la filosofía "tidy data" que las sustenta, lo que te permitirá escribir código más limpio, legible y reproducible. Además de las herramientas, nos centraremos en el desarrollo de un pensamiento analítico crítico. No se trata solo de aplicar funciones, sino de saber qué pregunta hacer a los datos, cómo seleccionar la técnica adecuada para responder y cómo evaluar la validez y las limitaciones de tus hallazgos. Abordaremos temas esenciales como la estadística descriptiva, que te permitirá caracterizar tus datos de manera robusta, y la estadística Abraham Zamudio