Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Usando o PostgreSQL para prever a compra de clientes

guedes
August 03, 2019

Usando o PostgreSQL para prever a compra de clientes

guedes

August 03, 2019
Tweet

More Decks by guedes

Other Decks in Programming

Transcript

  1. Contextualizando A Instacart, segundo a Wikipedia, é uma empresa prestadora

    de serviços de entrega de alimentos em um dia. Além de possuir uma base de dados de informações de compras muito rica, tornou-a open source, disponibilizando dados de aproximadamente 3 milhões de compras (3 million Instacart order open sourced) Competição Kaggle: Instacart Market Basket Analysis
  2. O propósito Prever quais os produtos serão comprados novamente pelos

    consumidores da Instacart, tendo como base as suas compras passadas
  3. Passos para construção do modelo Coleta, conjunto de entrada Análise

    Preparo, limpeza, normalização Teste, treino, validação Modelo e acurácia Previsão
  4. Conjunto de entrada • aisles.csv ◦ (134 x 2) •

    departments.csv ◦ (21 x 2) • products.csv ◦ (49.7k x 4) • orders.csv ◦ (3.42m x 7) • order_products__prior.csv ◦ (32.4m x 4) • order_products__train.csv ◦ (1.38m x 4) • sample_submission.csv ◦ (75.0k x 2) A base final ficou em torno de 2GB kaggle competitions download -c instacart-market-basket-analysis
  5. CSV Pandas Data Frame ML Fluxo dos dados inicial •

    https://pandas.pydata.org/pandas-docs/stable/getting_started/comparison/comparison_with_sql.html • https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html