Data Science na ContaAzul

Data Science na ContaAzul

Apresentação no 14º encontro da comunidade Data Science Joinville sobre a construção do que é ser um Cientista de dados na Conta Azul

6e3e4d5b447ebd1796eeedfd91bd92f1?s=128

Gabriel (Gabu) Bellon

November 29, 2018
Tweet

Transcript

  1. Data Science na ContaAzul

  2. Eu Gabriel Bellon @gabubellon gabubellon.me Cientista de Dados BAOps -Conta

    Azul • Itu-Limeira-Campinas/SP - Joinville/SC • Desde 2010 na área de Dados • BI Clássico • Startups • Python • Nerd • Games • Cerveja e afins
  3. Motivação O que a área de Data Science faz?

  4. Motivação Qual resultado a área de Data Science entrega ?

  5. Conteúdo • Motivação • The Professional Data Science Manifesto •

    Benchmark • Proposta de Framework
  6. The Professional Data Science Manifesto

  7. Manifesto Data science is about solving problems, not models or

    algorithms Data Science Manifesto Fonte: http://www.datasciencemanifesto.org/
  8. Manifesto Prior to building a model, construct an evaluation framework

    with end-to-end business focused acceptance criteria Data Science Manifesto Fonte: http://www.datasciencemanifesto.org/
  9. Benchmark

  10. Colleen Farrelly - Kaplan 30% 30% 40% Developing and testing

    algorithms Building relationships across departments and seeking new projects Data analysis and writing up results Fonte: https://www.kdnuggets.com/2017/11/day-life-data-scientist.html T I M E
  11. Marco Michelangeli - Hopenly “I don't really have a routine:

    I often discuss with business people and clients to understand their real needs, I help the marketing with contents on our products, I participate in meetings about new ETL workflows and architecture design for a new product to be realised” “If you can solve a client need with just a SQL query, do it! Do not frustrate yourself over complex machine learning models: be simple, be helpful” Fonte: https://www.kdnuggets.com/2017/11/day-life-data-scientist.html
  12. Dan Mallinger - Think Big “Data science begins by translating

    a business case into an analytics agenda” “As a data scientist, the most frustrating thing is to build models or do work that do not become part of the ongoing processes of the organization. To deal with this, we have checklists we cover before starting a project. These ensure that we understand the business case, there are key performance indicators (KPI) tied to the outcomes, and that there is a path to operationalization to ensure our work is integrated and lasting.” Fonte: https://lifehacker.com/career-spotlight-what-i-do-as-a-data-scientist-1684793405
  13. Data Scientist Algorithms home for those with expertise in machine

    learning • create business value by infusing data in our product and processes Data Scientist Inference • improve our decision making • measure the impact of our work Elena Grewal - Airbnb Fonte: https://www.linkedin.com/pulse/one-data-science-job-doesnt-fit-all-elena-grewal/ Data Scientist Analytics • ask a great question • explore cuts of the data in a revealing way • automate analysis through dashboards and visualizations • drive changes in the business as a result of recommendations
  14. Framework

  15. Motivação Por quê? • Ter um modus operandi padrão de

    Data Science para toda a empresa • Ter entregáveis claros para os nossos clientes • Mostrar os resultados das ações de Data Science para a empresa • Garantir a qualidade das entregas
  16. Framework Definição do problema Análise Exploratória Proposta de soluções Modelo

    de avaliação da solução Responder 3 perguntas 1. Qual o problema enfrentado? 2. Qual indicador mostra este problema? 3. Onde você gostaria que este indicador estivesse? Estudo e entendimento do problema • Procura de causas e influências no indicador que mostram o problema Analisando os dados observados, sugerir próximos passos • Propostas podem ou não ser o desenvolvimento de modelos estatísticos • Calcular ROI das propostas para poderem ser escolhidas/priorizadas • Estimar tempo de desenvolvimento Definir, antes de qualquer desenvolvimento, o método como será avaliada a solução • Qual métrica será influenciada • Qual deverá ser o valor desta métrica em quanto tempo para definir o projeto como sucesso
  17. Framework Desenvolvimento da solução Go Live Follow up Fechamento •

    Pode ou não ser o desenvolvimento de um modelo • Pode ou não ser de responsabilidade de um Data Scientist Produtização e deploy da solução • Teste AB Acompanhamento com periodicidade definida • Métrica principal que deve ser influenciada • Comparação da métrica principal com o estipulado como objetivo do projeto • Métricas de apoio Fechamento oficial do projeto com comunicação oficial do entregue e resultados atingidos, sejam eles positivos ou negativos
  18. Dúvidas?

  19. Anexos

  20. Obrigado :) Gabriel Bellon @gabubellon gabubellon.me gabriel.bellon@contaazul.com