Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data Science na ContaAzul

Data Science na ContaAzul

Apresentação no 14º encontro da comunidade Data Science Joinville sobre a construção do que é ser um Cientista de dados na Conta Azul

Gabriel (Gabu) Bellon

November 29, 2018
Tweet

More Decks by Gabriel (Gabu) Bellon

Other Decks in Technology

Transcript

  1. Data Science na ContaAzul

    View full-size slide

  2. Eu
    Gabriel Bellon
    @gabubellon
    gabubellon.me
    Cientista de Dados
    BAOps -Conta Azul
    ● Itu-Limeira-Campinas/SP -
    Joinville/SC
    ● Desde 2010 na área de Dados
    ● BI Clássico
    ● Startups
    ● Python
    ● Nerd
    ● Games
    ● Cerveja e afins

    View full-size slide

  3. Motivação
    O que a área de Data Science faz?

    View full-size slide

  4. Motivação
    Qual resultado a área de Data Science
    entrega ?

    View full-size slide

  5. Conteúdo
    ● Motivação
    ● The Professional Data Science Manifesto
    ● Benchmark
    ● Proposta de Framework

    View full-size slide

  6. The Professional Data
    Science Manifesto

    View full-size slide

  7. Manifesto
    Data science is about solving
    problems, not models or algorithms
    Data Science Manifesto
    Fonte: http://www.datasciencemanifesto.org/

    View full-size slide

  8. Manifesto
    Prior to building a model, construct an
    evaluation framework with end-to-end
    business focused acceptance criteria
    Data Science Manifesto
    Fonte: http://www.datasciencemanifesto.org/

    View full-size slide

  9. Colleen
    Farrelly -
    Kaplan
    30%
    30%
    40% Developing and testing algorithms
    Building relationships across departments
    and seeking new projects
    Data analysis and writing up results
    Fonte: https://www.kdnuggets.com/2017/11/day-life-data-scientist.html
    T
    I
    M
    E

    View full-size slide

  10. Marco
    Michelangeli -
    Hopenly
    “I don't really have a routine: I often discuss with business people and clients to
    understand their real needs, I help the marketing with contents on our
    products, I participate in meetings about new ETL workflows and architecture
    design for a new product to be realised”
    “If you can solve a client need with just a SQL query, do it! Do not frustrate
    yourself over complex machine learning models: be simple, be helpful”
    Fonte: https://www.kdnuggets.com/2017/11/day-life-data-scientist.html

    View full-size slide

  11. Dan Mallinger
    - Think Big
    “Data science begins by translating a business case into an analytics
    agenda”
    “As a data scientist, the most frustrating thing is to build models or do work
    that do not become part of the ongoing processes of the organization. To deal
    with this, we have checklists we cover before starting a project. These ensure
    that we understand the business case, there are key performance indicators
    (KPI) tied to the outcomes, and that there is a path to operationalization to
    ensure our work is integrated and lasting.”
    Fonte: https://lifehacker.com/career-spotlight-what-i-do-as-a-data-scientist-1684793405

    View full-size slide

  12. Data Scientist
    Algorithms
    home for those with expertise in
    machine learning
    ● create business value by infusing
    data in our product and processes
    Data Scientist
    Inference
    ● improve our decision making
    ● measure the impact of our work
    Elena Grewal -
    Airbnb
    Fonte: https://www.linkedin.com/pulse/one-data-science-job-doesnt-fit-all-elena-grewal/
    Data Scientist
    Analytics
    ● ask a great question
    ● explore cuts of the data in a
    revealing way
    ● automate analysis through
    dashboards and visualizations
    ● drive changes in the business as
    a result of recommendations

    View full-size slide

  13. Motivação
    Por quê?
    ● Ter um modus operandi padrão de Data Science para toda a empresa
    ● Ter entregáveis claros para os nossos clientes
    ● Mostrar os resultados das ações de Data Science para a empresa
    ● Garantir a qualidade das entregas

    View full-size slide

  14. Framework
    Definição do problema Análise Exploratória Proposta de soluções
    Modelo de avaliação da
    solução
    Responder 3 perguntas
    1. Qual o problema enfrentado?
    2. Qual indicador mostra este
    problema?
    3. Onde você gostaria que este
    indicador estivesse?
    Estudo e entendimento do
    problema
    ● Procura de causas e
    influências no indicador que
    mostram o problema
    Analisando os dados observados,
    sugerir próximos passos
    ● Propostas podem ou não ser
    o desenvolvimento de
    modelos estatísticos
    ● Calcular ROI das propostas
    para poderem ser
    escolhidas/priorizadas
    ● Estimar tempo de
    desenvolvimento
    Definir, antes de qualquer
    desenvolvimento, o método como
    será avaliada a solução
    ● Qual métrica será influenciada
    ● Qual deverá ser o valor desta
    métrica em quanto tempo para
    definir o projeto como sucesso

    View full-size slide

  15. Framework
    Desenvolvimento da solução Go Live Follow up Fechamento
    ● Pode ou não ser o
    desenvolvimento de um
    modelo
    ● Pode ou não ser de
    responsabilidade de um Data
    Scientist
    Produtização e deploy da solução
    ● Teste AB
    Acompanhamento com
    periodicidade definida
    ● Métrica principal que deve ser
    influenciada
    ● Comparação da métrica
    principal com o estipulado
    como objetivo do projeto
    ● Métricas de apoio
    Fechamento oficial do projeto com
    comunicação oficial do entregue e
    resultados atingidos, sejam eles
    positivos ou negativos

    View full-size slide

  16. Obrigado :)
    Gabriel Bellon
    @gabubellon
    gabubellon.me
    [email protected]

    View full-size slide