Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Agile & Big Data

Agile & Big Data

Ágiles Perú 2019

Victoria Ubaldo

April 04, 2019
Tweet

More Decks by Victoria Ubaldo

Other Decks in Business

Transcript

  1. LA DATA SE ENCUENTRA DISTRIBUIDA Problemas en actualización diversidad y

    veracidad de fuentes Datos ingresados por muchas personas
  2. El enfoque que aprendimos de gestión de datos no es

    suficiente Obliga al uso de clústeres.
  3. Realizar análisis de datos con proyectos pequeños y rápidos centrados

    en un objetivo de negocio en particular. AGILE LOGISTICA EXTRACCIÓN VISUALIZACIÓN INTERPRETACIÓN
  4. • Hojas de cálculo, presentaciones, archivos PDF • Datos de

    proveedores • Speech to text • Web scraping Extraer datos es complejo, pero el verdadero problema es saber dónde mirar. EXTRACCIÓN
  5. • A menudo, sólo los profesionales en tecnología que trabajan

    con aplicaciones en el día a día son los que saben dónde se esconden los datos útiles. • Pero no saber cuán potencialmente valioso puede ser.
  6. La gente de negocios a menudo es consciente de los

    problemas, pero no sabe cómo los datos pueden ayudarlos, si esos datos existen, y si es así ¿dónde están?
  7. Se debe repensar el papel y objetivos de un gestor

    de base de datos ( data management) . LOGÍSTICA
  8. Basado principalmente en bases de datos relacionales enfocado en almacenar

    solo datos validados Ahora deben considerar qué tecnología de base de datos es apropiada para su situación, en lugar de utilizar una sola tecnología (relacional) para todo. Los cambios requieren nuevas estrategias
  9. Data Aggregation Almacenan estructuras complejas de datos en una sola

    unidad, en lugar de distribuir los datos en muchas filas en muchas tablas. (hacer agregados, estadísticas,"conteos")
  10. Grafos Bueno para pequeñas unidades de datos con estructuras ricas

    de conexión. Diseñados para un recorrido rápido a través de la estructura del gráfico.
  11. Hemos encontrado que las bases de datos NoSQL son adecuadas

    para aplicaciones empresariales, pero no significa que el modelo relacional está muerto.
  12. • El modelo de datos relacional es la elección correcta

    para muchos tipos de datos. • Las bases de datos relacionales son tecnología madura, con la que muchas personas están familiarizadas y tienen buenas herramientas.
  13. 6 meses es demasiado tiempo para una acción efectiva •

    Los tiempos de ciclo largos conducen a un esfuerzo inútil. • Los tiempos de ciclo lentos reducen la capacidad de aprender. • La velocidad en el aprendizaje amplifica la ventaja de la velocidad a través del ciclo.
  14. Por lo tanto, necesitas un enfoque ágil con ciclos rápidos

    • Debemos reducir el alcance de cada ciclo para ejecutarlo rápidamente • Usando los resultados de un ciclo para decidir qué hacer en el siguiente.
  15. Establece un objetivo de negocio Elige un aspecto pequeño y

    simple de la meta como punto de partida analítico Valide la utilidad y la capacidad de acción de los resultados con las partes interesadas del negocio Repetir, explorando más aspectos del objetivo,
  16. Pautas para un enfoque de análisis ágil : • Equipos

    pequeños, muy centrados en un aspecto a la vez. • No intente construir un gran marco analítico, resuelva problemas particulares y coseche un marco. • Favorezca herramientas livianas ( que permitan desarrollar gradualmente la capacidad a medida que la necesite). • Trate la operación analítica como un proyecto de desarrollo de software ágil, con las disciplinas habituales para el desarrollo ágil de aplicaciones.
  17. Ejemplos de mal razonamiento intuitivo con estadísticas, sesgos Comúnmente cometemos

    errores en atribuir una causa a algo que es sólo casualidad. INTERPRETACIÓN
  18. • Ilusión probabilística. • Al igual que las ilusiones ópticas

    confunden el ojo, las ilusiones probabilísticas confunden nuestro razonamiento. • Cuando usamos más los datos, este problema es más frecuente, incluso los científicos y matemáticos se dejan engañar con frecuencia por estas ilusiones.
  19. Es nuestra responsabilidad : • Educarnos a nosotros mismos y

    a nuestros usuarios sobre las ilusiones probabilísticas. • Asegurarnos de que la información que las personas encuentren no sea solo ruido estadístico. • Tener un mejor control de la probabilidad y las estadísticas, para alertarnos de posibles problemas. • Incorporar habilidades estadísticas.
  20. • Ayudan a convertir los datos en información • Las

    buenas visualizaciones deben centrarse en cómo los datos pueden informar los objetivos que tiene para sus análisis. • Una buena manera de aprender sobre la visualización es explorar ejemplos de diferentes enfoques. VISUALIZAR
  21. • Las visualizaciones impresionantes pueden ser extremadamente valiosas. • Pero

    no se obsesione con uno complejo, puede crear visualizaciones útiles con un esfuerzo sorprendentemente pequeño.
  22. Entonces ... ¿es Big Data == Big Hype? • Hay

    cambios significativos en la forma en que nos aparecen los datos, que provocan acciones apropiadas para la respuesta de nuestra profesión.
  23. Big Data !=Grandes proyectos • Cualquier proyecto de software debe

    incorporar el pensamiento "Big Data" • Muchos proyectos de software pueden hacer más para exponer sus datos de manera efectiva. • Colaboremos estrechamente con clientes y usuarios para explorar qué datos son útiles.
  24. Recomendaciones :) • Tenga cuidado para evitar ilusiones probabilísticas •

    Experimente con visualizaciones, comenzando con las simples que se pueden construir rápidamente • Todo esto requiere un pensamiento innovador, que generalmente proviene de equipos pequeños y diversos que operan dentro de un proceso autoadaptativo.