Slide 1

Slide 1 text

Fernando Felix @ linkedin.com/in/fernandofnjr github.com/fernandojunior Como maximizar o valor de projetos de Data Science? 1

Slide 2

Slide 2 text

Resumo Introdução Data Science/Analytics Processo Data Mining Problema Profissões de Dados Metodologias - O que, Quando e Como? Por que projetos falham? Design Thinking Lean Startup Metodologia Ágil 2

Slide 3

Slide 3 text

Introdução 3

Slide 4

Slide 4 text

2021 2010 BI Analyst Software Engineer 2010 Software Engineer 2016 Software Engineer ML/DL Engineer 2017 Data Scientist 2018 2016 2017 2019 2008 2008-2012 Telemática Data Scientist 2019 Data Scientist 2021 2015-2017 Mestrado 2015 2020 Especialização Online 2012 2018 2020 Startup & Consultoria 4

Slide 5

Slide 5 text

Em 2022, 90% das estratégias empresariais terão: informação como ativo crítico, Analytics como uma competência essencial (Gartner , 2019). Quem pode aprender mais rápido está em melhor posição para ter sucesso. Empresas inteligentes investirão em Analytics para se antecipar ao que está por vir (Cassie Kozyrkov - Google, 2020). 5

Slide 6

Slide 6 text

Data Science/Analytics 6

Slide 7

Slide 7 text

1. Objetivos e requisitos de negócios. Converter o conhecimento em uma definição de problema de dados (business metrics vs model metrics) e um plano preliminar. 2. Coleta inicial de dados. Familiarizar com os dados. Qualidade de dados. Extrair os insights iniciais, detectar padrões para formar hipóteses. 3. Seleção de atributos, transformação e limpeza de dados (features) para ferramentas de modelagem ou análise de dados. 4. Seleção e aplicação de técnicas (heurística, ML, estatística, etc.). Otimização de parâmetros. Algumas técnicas possuem requisitos específicos. 5. Revisar etapas anteriores para ter certeza que os objetivos de negócios serão contemplados (business/model metrics). Ex: Alguma questão comercial/legal importante que não foi considerada? 6. Dado os requisitos, essa fase pode simples (gerar um relatório) ou complexa (implementar um processo repetível e escalável). CRISP-DM, 1996 7

Slide 8

Slide 8 text

+ Data Analysts + Statistician... Profissões de Dados Harshit Tyagi, 2021 8

Slide 9

Slide 9 text

85% dos projetos de Big Data falham (Gartner, 2017) 87% dos projetos de Ciência de Dados não vão à produção (VentureBeat, 2019) Até 2022, 80% dos insights analíticos não entregarão resultados (Gartner , 2019) Problema 9

Slide 10

Slide 10 text

Por que projetos falham? Becker, 2017 CB Insights, 2021 alexandercowan.com 10

Slide 11

Slide 11 text

Metodologias 11

Slide 12

Slide 12 text

Metodologias - O Que, Quando e Como? Gartner, 2019 12

Slide 13

Slide 13 text

13

Slide 14

Slide 14 text

Se não estiver alinhado com uma necessidade humana, você construirá uma solução poderosa para um problema pequeno. Google Design - UX AI Antes de algoritmos, como as pessoas fazem a tarefa hoje? (jornada). O que é valioso? Como aprimorar? https://uxofai.com/ Pense em dar dicas aos usuários sobre o que o algoritmo faz ou dados ele usa. Ex: em um e-commerce, podemos explicar porque recomendamos certos produtos. uxstudio - UX AI Usar dados reais para planejar protótipos ajuda a construir o modelo. Ex: MvP para obter a experiência do usuário antes de IA. https://uxofai.com/ Não tenha medo de lançar um produto sem ML. Se você está classificando apps (Google Play), use a taxa de instalação como heurística. Rules of ML (Google) 14

Slide 15

Slide 15 text

15

Slide 16

Slide 16 text

CRISP-DM Entendimento do Negócio 16

Slide 17

Slide 17 text

17

Slide 18

Slide 18 text

Lean (1980) - Toyota - otimizar a produção de veículos no Japão. Lean Startup (2011) - Eric Ries - otimizar produtos e serviços de forma contínua, revisar processos internos, conforme feedback do cliente. Identificação e eliminação de desperdícios nos processos 1. Canvas: diagrama que mostra como criar valor para si e para os clientes 2. Testar hipóteses com MVP e “desenvolvimento com clientes”. Pivot ou continua? 3. “Desenvolvimento ágil” para desenvolver o produto de forma iterativa e incremental Design Thinking Lean Startup 18

Slide 19

Slide 19 text

Canvas 19

Slide 20

Slide 20 text

Canvas 20

Slide 21

Slide 21 text

Canvas 21

Slide 22

Slide 22 text

Canvas 22

Slide 23

Slide 23 text

MVP 23

Slide 24

Slide 24 text

Stakeholders Feedback Stakeholders Feedback Stakeholders Feedback fourweekmba.com MVP 24

Slide 25

Slide 25 text

25

Slide 26

Slide 26 text

Metodologia Ágil 26

Slide 27

Slide 27 text

Metodologia Ágil Sprints de duas - quatro semanas com datas claras de início e término. O período de tempo curto força a divisão de tarefas complexas em histórias menores e ajuda a equipe a aprender rápido. Sua equipe consegue lançar código utilizável tão rápido? 27

Slide 28

Slide 28 text

Metodologia Ágil Kanban não prescreve um tempo fixo para entregar uma tarefa. Se a tarefa for concluída mais cedo (ou mais tarde), ela pode ser lançada conforme necessário sem ter que esperar por um marco de lançamento, como revisão de sprint. 28

Slide 29

Slide 29 text

● Domine os principais objetivos, escopo e métricas de negócio ● Não tenha medo de lançar um experimento/produto sem machine learning ● Tenha ou busque ter um repositório curado e catalogado de dados ○ Data Lake, Data Warehouse, Lake House, Feature Store, etc. ● Não reinvente a roda - Extraia o máximo de valor possível do conhecimento e ferramentas existentes ○ AutoML, Cloud, etc. ● Tenha também seus próprios atalhos para facilitar experimentação e produtização. ○ Scaffold/templates, bibliotecas de utilidades, modelos, etc. ○ Boas práticas de engenharia para produtizar modelo viáveis (ex: CI / CD, revisão de código, código limpo, etc.) ● Tenha uma infra e mecanismos que facilitem implantação de experimentos / modelos Dicas Finais Experimentações (PoCs, MVPs) Produtização Bibliotecas / Frameworks Validação (Teste A/B) github.com/NeowayLabs/data-science-template github.com/nubank/fklearn github.com/quintoandar/butterfree https://github.com/PicPay 29

Slide 30

Slide 30 text

Obrigado! Dúvidas? 30 Fernando Felix @ linkedin.com/in/fernandofnjr github.com/fernandojunior