Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Experiencias en herramientas para Ciencias de datos.

matiskay
September 16, 2016

Experiencias en herramientas para Ciencias de datos.

matiskay

September 16, 2016
Tweet

More Decks by matiskay

Other Decks in Programming

Transcript

  1. EXPERIENCIAS EN HERRAMIENTAS PARA CIENCIA DE DATOS Edgar Marca [email protected]

    Conversatorio: BigDataHack Septiembre 15 del 2016 Lima - Perú
  2. About Edgar Marca Software Engineer at Love Mondays (Helping people

    to love Mondays.). One of the organizers of Data Science Lima Meetup. Machine Learning and Data Science enthusiasm. twitter: @matiskay 1
  3. Los datos nunca duermen. Figure: Cuantos datos se generan cada

    minuto? 1 1Data Never Sleeps 3.0 https://www.domo.com/blog/2015/08/data-never-sleeps-3-0/ 5
  4. • Permite usar vários modelos em uma interface de simples

    utilização • Workflow simples 1. Primeramente se obtém os dados de presença e os dados meteorológicos. 2. De forma paralela estes dados são processados e usados para a geração do modelo. 3. Este modelo é projetado sobre um mapa no qual é o resultado final do aplicativo. Figura 4 - Workflow do aplicativo.
  5. ➔ O aplicativo é composto por 5 etapas, as quais

    implementan o workflow descrito na figura 4. 1) Coleta dos dados Para este exemplo os dados são obtidos de uma fonte de dados externa chamada Gbif. Figura 5 - Dados da espécie Rupicola peruviana.
  6. What the Fuck Are Trump Supporters Thinking? They gathered four

    million tweets belonging to more than two thousand hard-core Trump supporters. Distances between those vectors encoded the semantic distance between their associated words (e.g. the vector representation of the word morons was near idiots but far away from funny) Link: https://medium.com/adventurous-social-science/ what-the-fuck-are-trump-supporters-thinking-ecc16fb66a8d 38
  7. Mensajes para llevar a casa Los conceptos son mas importantes

    que las herramientas. Aprendizaje a demanda. Aprender al menos un lenguaje de programacion Python o R. Es un trabajo multi-disciplinar. Construir herramientas para analisis. 26