Slide 1

Slide 1 text

Deploy de Modelos em Produção: Chegou a Hora do DataOps? Daniela Petruzalek Development Consultant @ ThoughtWorks Google Developer Expert daniela.petruzalek@gmail.com

Slide 2

Slide 2 text

O Ministério da Saúde Adverte: Esta talk contém uma alta densidade de buzzwords.

Slide 3

Slide 3 text

Agenda - Desafios do deploy de modelos - DevOps - DataOps - Tecnologias

Slide 4

Slide 4 text

O Desafio de Negócio

Slide 5

Slide 5 text

Maturidade das Organizações em Data

Slide 6

Slide 6 text

Data no Mundo Ideal Academia P&D Ciência de Dados Engenharia de Dados Negócio Tecnologia Modelo

Slide 7

Slide 7 text

Mas na Prática...

Slide 8

Slide 8 text

No content

Slide 9

Slide 9 text

O Caminho para o ML: Vida Real Academia P&D Ciência de Dados Engenharia de Dados Negócio Tecnologia Modelo ?????

Slide 10

Slide 10 text

No content

Slide 11

Slide 11 text

No content

Slide 12

Slide 12 text

No content

Slide 13

Slide 13 text

No content

Slide 14

Slide 14 text

O Desafio da Tecnologia

Slide 15

Slide 15 text

Fases de Preparação dos Modelos Coleta dos Dados Análise Exploratória Limpeza dos Dados Treinamento Validação do Modelo Deploy Monitoração / Teste AB ESCOLHA DO MODELO MANUTENÇÃO DO MODELO

Slide 16

Slide 16 text

Fatores que Influenciam o Deploy Tipo de Aprendizado Tipo de Predição Modelos: Small Data x Big Data Processamento: Batch x Online (Real Time / Near-Real Time) Target: Container x Cluster (Cloud vs On-premises)

Slide 17

Slide 17 text

Tipos de Deploy https://www.quora.com/How-do-you-take-a-machine-learning-model-to-production

Slide 18

Slide 18 text

Débito Técnico Oculto em Machine Learning https://papers.nips.cc/paper/5656-hidden-technical-debt-in-machine-learning-systems.pdf

Slide 19

Slide 19 text

DevOps

Slide 20

Slide 20 text

"organizations which design systems ... are constrained to produce designs which are copies of the communication structures of these organizations." - Melvin Conway, 1967

Slide 21

Slide 21 text

Pontos Chave na Cultura DevOps - CALMS: - Culture - Automation - Lean Management - Measurement - Sharing

Slide 22

Slide 22 text

Princípios Básicos - Acabar com silos - Organização de times de operações e desenvolvimento - Divisão de conhecimento entre times, falta de colaboração - Acidentes são normais - Foco na recuperação rápida e não em achar culpados - Os erros são coletivos

Slide 23

Slide 23 text

Princípios Básicos - Mudanças devem ser graduais - Mudanças devem ser pequenas e frequentes - Continuous Integration & Continuous Deployment - Ferramentas e cultura estão interrelacionados - Com ferramentas erradas e a cultura certa ainda é possível sair do outro lado - O oposto não é verdade

Slide 24

Slide 24 text

Implementações de DevOps - SRE (Google) - PE (Facebook)

Slide 25

Slide 25 text

DataOps

Slide 26

Slide 26 text

No content

Slide 27

Slide 27 text

http://dataopsmanifesto.org/

Slide 28

Slide 28 text

Tecnologias

Slide 29

Slide 29 text

No content

Slide 30

Slide 30 text

No content

Slide 31

Slide 31 text

No content

Slide 32

Slide 32 text

No content

Slide 33

Slide 33 text

https://www.kubeflow.org/

Slide 34

Slide 34 text

No content

Slide 35

Slide 35 text

Cloud e “Clusters Efemeros” https://hackernoon.com/why-dataproc-googles-managed-hadoop-and-spark-offering-is-a-game-changer-9f0ed183fda3

Slide 36

Slide 36 text

Cloud e “Clusters Efemeros”

Slide 37

Slide 37 text

http://www.pachyderm.io/

Slide 38

Slide 38 text

No content

Slide 39

Slide 39 text

daniela.petruzalek@gmail.com https://linkedin.com/in/petruzalek https://twitter.com/danicat83 Questions?

Slide 40

Slide 40 text

No content