Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Mineria de Datos

Mineria de Datos

Presentación sobre mineria de datos en el XVIII Congreso Nacional de Fiscalización organizado por la Contraloria General de Costa Rica

Frans van Dunné

September 19, 2018
Tweet

More Decks by Frans van Dunné

Other Decks in Business

Transcript

  1. Mineria de Datos VIII Congreso Nacional de Gestión y Fiscalización

    de la Hacienda Pública 19 de Septiembre, 2018 Frans van Dunné @fransvandunne
  2. Agenda Introducción y objetivos ¿Porque Minería de Datos? Tengo Datos

    ¿Ahora Que? Alinea visiones DATA Resumen y Discusión @fransvandunne
  3. ¿De que hablamos? Declaraciones tributarias Recaudo impuesto SINIRUBE Censos Registro

    Nacional CCSS Mayores eficiencias Menos evasión de impuestos Menos corrupción Más participación ciudadana Major sostenibilidad Impacto sobre desarrollo social ?
  4. ?

  5. Source: Matt Turck, Jim Hao & First Mark Capital Data

    Mining Machine Learning SVM Cross validation Random forest R Studio Linear regression Logistic regression Hadoop Python Neural networks Deep learning K-means Statistical significance Boosting Algorithm xlsx Tableau
  6. Con análisis predictivo podemos predecir el comportamiento de tributantes Podemos

    trabajar con datos que son mina de oro y contribuyen al bien social Nuestro trabajo no solo tiene impacto para tributantes, pero también sobre la eficiencia interna
  7. Tengo datos, ahora que? comparar agrupar predecir reconocer asociar quiero

    volumen variedad velocidad veracidad valor tienen continuos ordinales nominales palabras imagenes son Modelo Algoritmo Visualización
  8. Reunir Inferir Decidir Actuar! Productos de datos Exploración y Modelado

    Medir y Evaluar Censo Impuestos viales IVA Impuestos Renta Procomer Catastro Aduanas IMAS ... es convertir datos en acciones y dar soporte a decisiones Preguntas y Objetivos
  9. Ingerir y Almacenar Organizar y Limpiar Dataducto Integrar y Validar

    Analizar y Modelar Fuentes de Datos Productos de Datos Incremento de Valor de los Datos Datos Informe Modelo Visualización Censo Impuestos viales IVA Impuestos Renta Procomer Catastro Aduanas IMAS
  10. BIG DATA Oracle big data is larger, more complex data

    sets, especially from new data sources. These data sets are so voluminous that traditional data processing software just can’t manage them. Gartner "Big data" is high-volume, -velocity and -variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making. Microsoft The term “big data” is being used to describe an increasing range of technologies and techniques. In essence, big data is data that is valuable but, traditionally, it was not practical to store or analyze it due to limitations of cost or the absence of suitable mechanisms. McKinsey “Big data” refers to datasets whose size is beyond the ability of typical database software tools to capture, store, manage, and analyze.
  11. Que es Big Data - Conjuntos de datos cuyo tamaño

    va más allá de bases de datos comunes - Datos que son valiosos pero, tradicionalmente, no eran práctico de almacenar y analizarlos - Activos de información de alto volumen, alta velocidad y alto variedad - Conjuntos de datos más grandes y más complejos, especialmente provenientes de fuentes nuevas
  12. Valor Dificultad Retrospección Comprensión Previsión Análisis Descriptivo ¿Qué Paso? Análisis

    Diagnóstico ¿Porqué Paso? Análisis Predictivo ¿Qué Pasará? Análisis Prescriptivo ¿Como lograrlo?
  13. En resumen :: Mineria de Datos convertir datos en acciones

    se puede aprender necesario para mejorar eficiencia y abarcar cambios en la sociedad responder preguntas y reconocer patrones crear productos de datos Trabajo en equipo diferente