Usando o PostgreSQL para prever a compra de clientes

8b3d54cbc4d678ba19de7ee8aea25cb1?s=47 guedes
August 03, 2019

Usando o PostgreSQL para prever a compra de clientes

8b3d54cbc4d678ba19de7ee8aea25cb1?s=128

guedes

August 03, 2019
Tweet

Transcript

  1. Usando PostgreSQL para prever a compra de clientes por Dickson

    S. Guedes PGConf.Brasil 2019
  2. Contextualizando A Instacart, segundo a Wikipedia, é uma empresa prestadora

    de serviços de entrega de alimentos em um dia. Além de possuir uma base de dados de informações de compras muito rica, tornou-a open source, disponibilizando dados de aproximadamente 3 milhões de compras (3 million Instacart order open sourced) Competição Kaggle: Instacart Market Basket Analysis
  3. O propósito Prever quais os produtos serão comprados novamente pelos

    consumidores da Instacart, tendo como base as suas compras passadas
  4. Passos para construção do modelo Coleta, conjunto de entrada Análise

    Preparo, limpeza, normalização Teste, treino, validação Modelo e acurácia Previsão
  5. Recursos, ferramentas e técnicas PostgreSQL 9.6 kaggle Jupyter Lab Python

    XGBoost SQL Featured-matrix
  6. Conjunto de entrada • aisles.csv ◦ (134 x 2) •

    departments.csv ◦ (21 x 2) • products.csv ◦ (49.7k x 4) • orders.csv ◦ (3.42m x 7) • order_products__prior.csv ◦ (32.4m x 4) • order_products__train.csv ◦ (1.38m x 4) • sample_submission.csv ◦ (75.0k x 2) A base final ficou em torno de 2GB kaggle competitions download -c instacart-market-basket-analysis
  7. CSV Pandas Data Frame ML Fluxo dos dados inicial •

    https://pandas.pydata.org/pandas-docs/stable/getting_started/comparison/comparison_with_sql.html • https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
  8. CSV SQL Data Frame ML Fluxo dos dados utilizado

  9. Vamos para o notebook

  10. Questões?

  11. Obrigado! github: @guedes twitter/telegram: @guediz