Eu Gabriel Bellon @gabubellon gabubellon.me Cientista de Dados BAOps -Conta Azul ● Itu-Limeira-Campinas/SP - Joinville/SC ● Desde 2010 na área de Dados ● BI Clássico ● Startups ● Python ● Nerd ● Games ● Cerveja e afins
Manifesto Prior to building a model, construct an evaluation framework with end-to-end business focused acceptance criteria Data Science Manifesto Fonte: http://www.datasciencemanifesto.org/
Colleen Farrelly - Kaplan 30% 30% 40% Developing and testing algorithms Building relationships across departments and seeking new projects Data analysis and writing up results Fonte: https://www.kdnuggets.com/2017/11/day-life-data-scientist.html T I M E
Marco Michelangeli - Hopenly “I don't really have a routine: I often discuss with business people and clients to understand their real needs, I help the marketing with contents on our products, I participate in meetings about new ETL workflows and architecture design for a new product to be realised” “If you can solve a client need with just a SQL query, do it! Do not frustrate yourself over complex machine learning models: be simple, be helpful” Fonte: https://www.kdnuggets.com/2017/11/day-life-data-scientist.html
Dan Mallinger - Think Big “Data science begins by translating a business case into an analytics agenda” “As a data scientist, the most frustrating thing is to build models or do work that do not become part of the ongoing processes of the organization. To deal with this, we have checklists we cover before starting a project. These ensure that we understand the business case, there are key performance indicators (KPI) tied to the outcomes, and that there is a path to operationalization to ensure our work is integrated and lasting.” Fonte: https://lifehacker.com/career-spotlight-what-i-do-as-a-data-scientist-1684793405
Data Scientist Algorithms home for those with expertise in machine learning ● create business value by infusing data in our product and processes Data Scientist Inference ● improve our decision making ● measure the impact of our work Elena Grewal - Airbnb Fonte: https://www.linkedin.com/pulse/one-data-science-job-doesnt-fit-all-elena-grewal/ Data Scientist Analytics ● ask a great question ● explore cuts of the data in a revealing way ● automate analysis through dashboards and visualizations ● drive changes in the business as a result of recommendations
Motivação Por quê? ● Ter um modus operandi padrão de Data Science para toda a empresa ● Ter entregáveis claros para os nossos clientes ● Mostrar os resultados das ações de Data Science para a empresa ● Garantir a qualidade das entregas
Framework Definição do problema Análise Exploratória Proposta de soluções Modelo de avaliação da solução Responder 3 perguntas 1. Qual o problema enfrentado? 2. Qual indicador mostra este problema? 3. Onde você gostaria que este indicador estivesse? Estudo e entendimento do problema ● Procura de causas e influências no indicador que mostram o problema Analisando os dados observados, sugerir próximos passos ● Propostas podem ou não ser o desenvolvimento de modelos estatísticos ● Calcular ROI das propostas para poderem ser escolhidas/priorizadas ● Estimar tempo de desenvolvimento Definir, antes de qualquer desenvolvimento, o método como será avaliada a solução ● Qual métrica será influenciada ● Qual deverá ser o valor desta métrica em quanto tempo para definir o projeto como sucesso
Framework Desenvolvimento da solução Go Live Follow up Fechamento ● Pode ou não ser o desenvolvimento de um modelo ● Pode ou não ser de responsabilidade de um Data Scientist Produtização e deploy da solução ● Teste AB Acompanhamento com periodicidade definida ● Métrica principal que deve ser influenciada ● Comparação da métrica principal com o estipulado como objetivo do projeto ● Métricas de apoio Fechamento oficial do projeto com comunicação oficial do entregue e resultados atingidos, sejam eles positivos ou negativos