Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Como maximizar o valor de projetos de Data Scie...

Como maximizar o valor de projetos de Data Science?

Muitos projetos de Ciência de Dados falham na prática. Na verdade, de acordo com um estudo recente do Gartner, 85% deles ficam aquém das expectativas. A literatura geral da indústria está repleta de alguns motivos de senso comum, como habilidades erradas ou inadequadas da equipe, objetivos de negócios incorretos, complexidade tecnológica, dentre outros. Nessa palestra irei abordar como alguns métodos (Design Thinking, Lean, Agile, CRISP-DM, etc.) podem ser combinados para serem aplicados em projetos de ciência de dados e, assim, ajudar os líderes e suas equipes a maximizar os resultados de negócios dos clientes de maneira data-driven.

Fernando Felix

September 19, 2021
Tweet

More Decks by Fernando Felix

Other Decks in Technology

Transcript

  1. Resumo Introdução Data Science/Analytics Processo Data Mining Problema Profissões de

    Dados Metodologias - O que, Quando e Como? Por que projetos falham? Design Thinking Lean Startup Metodologia Ágil 2
  2. 2021 2010 BI Analyst Software Engineer 2010 Software Engineer 2016

    Software Engineer ML/DL Engineer 2017 Data Scientist 2018 2016 2017 2019 2008 2008-2012 Telemática Data Scientist 2019 Data Scientist 2021 2015-2017 Mestrado 2015 2020 Especialização Online 2012 2018 2020 Startup & Consultoria 4
  3. Em 2022, 90% das estratégias empresariais terão: informação como ativo

    crítico, Analytics como uma competência essencial (Gartner , 2019). Quem pode aprender mais rápido está em melhor posição para ter sucesso. Empresas inteligentes investirão em Analytics para se antecipar ao que está por vir (Cassie Kozyrkov - Google, 2020). 5
  4. 1. Objetivos e requisitos de negócios. Converter o conhecimento em

    uma definição de problema de dados (business metrics vs model metrics) e um plano preliminar. 2. Coleta inicial de dados. Familiarizar com os dados. Qualidade de dados. Extrair os insights iniciais, detectar padrões para formar hipóteses. 3. Seleção de atributos, transformação e limpeza de dados (features) para ferramentas de modelagem ou análise de dados. 4. Seleção e aplicação de técnicas (heurística, ML, estatística, etc.). Otimização de parâmetros. Algumas técnicas possuem requisitos específicos. 5. Revisar etapas anteriores para ter certeza que os objetivos de negócios serão contemplados (business/model metrics). Ex: Alguma questão comercial/legal importante que não foi considerada? 6. Dado os requisitos, essa fase pode simples (gerar um relatório) ou complexa (implementar um processo repetível e escalável). CRISP-DM, 1996 7
  5. 85% dos projetos de Big Data falham (Gartner, 2017) 87%

    dos projetos de Ciência de Dados não vão à produção (VentureBeat, 2019) Até 2022, 80% dos insights analíticos não entregarão resultados (Gartner , 2019) Problema 9
  6. 13

  7. Se não estiver alinhado com uma necessidade humana, você construirá

    uma solução poderosa para um problema pequeno. Google Design - UX AI Antes de algoritmos, como as pessoas fazem a tarefa hoje? (jornada). O que é valioso? Como aprimorar? https://uxofai.com/ Pense em dar dicas aos usuários sobre o que o algoritmo faz ou dados ele usa. Ex: em um e-commerce, podemos explicar porque recomendamos certos produtos. uxstudio - UX AI Usar dados reais para planejar protótipos ajuda a construir o modelo. Ex: MvP para obter a experiência do usuário antes de IA. https://uxofai.com/ Não tenha medo de lançar um produto sem ML. Se você está classificando apps (Google Play), use a taxa de instalação como heurística. Rules of ML (Google) 14
  8. 15

  9. 17

  10. Lean (1980) - Toyota - otimizar a produção de veículos

    no Japão. Lean Startup (2011) - Eric Ries - otimizar produtos e serviços de forma contínua, revisar processos internos, conforme feedback do cliente. Identificação e eliminação de desperdícios nos processos 1. Canvas: diagrama que mostra como criar valor para si e para os clientes 2. Testar hipóteses com MVP e “desenvolvimento com clientes”. Pivot ou continua? 3. “Desenvolvimento ágil” para desenvolver o produto de forma iterativa e incremental Design Thinking Lean Startup 18
  11. 25

  12. Metodologia Ágil Sprints de duas - quatro semanas com datas

    claras de início e término. O período de tempo curto força a divisão de tarefas complexas em histórias menores e ajuda a equipe a aprender rápido. Sua equipe consegue lançar código utilizável tão rápido? 27
  13. Metodologia Ágil Kanban não prescreve um tempo fixo para entregar

    uma tarefa. Se a tarefa for concluída mais cedo (ou mais tarde), ela pode ser lançada conforme necessário sem ter que esperar por um marco de lançamento, como revisão de sprint. 28
  14. • Domine os principais objetivos, escopo e métricas de negócio

    • Não tenha medo de lançar um experimento/produto sem machine learning • Tenha ou busque ter um repositório curado e catalogado de dados ◦ Data Lake, Data Warehouse, Lake House, Feature Store, etc. • Não reinvente a roda - Extraia o máximo de valor possível do conhecimento e ferramentas existentes ◦ AutoML, Cloud, etc. • Tenha também seus próprios atalhos para facilitar experimentação e produtização. ◦ Scaffold/templates, bibliotecas de utilidades, modelos, etc. ◦ Boas práticas de engenharia para produtizar modelo viáveis (ex: CI / CD, revisão de código, código limpo, etc.) • Tenha uma infra e mecanismos que facilitem implantação de experimentos / modelos Dicas Finais Experimentações (PoCs, MVPs) Produtização Bibliotecas / Frameworks Validação (Teste A/B) github.com/NeowayLabs/data-science-template github.com/nubank/fklearn github.com/quintoandar/butterfree https://github.com/PicPay 29