PyBR15 - Cada um Com Seu Modelo

PyBR15 - Cada um Com Seu Modelo

Palestra Utilizada na https://2019.pythonbrasil.org.br/

Todo mundo gosta de classificar seus gastos a sua maneira, então, como sugerir uma classificação "única" para uma base gigante de pessoas? Nesta palestra, apresentaremos uma solução para modelar, treinar, predizer e sugerir em qual classificação determinado lançamento financeiro se encaixa. De maneira dinâmica e automática, utilizando scikit-learn, temos uma solução que cria e gerencia automaticamente modelos individuais para os usuários da plataforma Conta Azul. Uma solução robusta e simples, feita para permitir personalização e automatização aos usuários na hora de realizar seus lançamentos financeiros

6e3e4d5b447ebd1796eeedfd91bd92f1?s=128

Gabriel (Gabu) Bellon

October 26, 2019
Tweet

Transcript

  1. 1.
  2. 2.

    • Nerd / Geek / Livros / Quadrinho / Games

    / Cervejas • Itu(SP) -> Limeira(SP) -> Campinas(SP) -> Joinville(SC) • Unicamp / FIAP • Delphi-> SQL -> C# -> DBA -> Dados -> Ciência de Dados • 10+ anos na área de TI • Codenation • Python Joinville & Data Science Joinville • Python Brasil: Segunda participação e a Primeira palestra Gabriel Bellon (Gabu) / @gabubellon
  3. 6.
  4. 7.
  5. 8.
  6. 9.
  7. 11.
  8. 12.
  9. 13.
  10. 15.
  11. 16.
  12. 17.
  13. 18.
  14. 19.
  15. 23.
  16. 24.
  17. 25.
  18. 26.
  19. 27.
  20. 28.
  21. 30.
  22. 33.
  23. 36.
  24. 37.
  25. 38.
  26. 41.

    PAGTO. ALUGUEL RECEB. ALUGUEL SCORE - Acertando Melhor ACCURACY -

    Com Maior Frequência PAGTO. ALUGUEL RECEB. ALUGUEL
  27. 42.

    PAGTO. ALUGUEL RECEB. ALUGUEL SCORE - Acertando Melhor ACCURACY -

    Com Maior Frequência PAGTO. ALUGUEL RECEB. ALUGUEL RECEB. ALUGUEL
  28. 43.
  29. 44.
  30. 45.
  31. 46.
  32. 47.
  33. 48.
  34. 49.
  35. 50.
  36. 51.
  37. 52.
  38. 53.
  39. 54.
  40. 55.
  41. 56.
  42. 57.

    • Múltiplos Modelos: ◦ 1 modelo para crédito e 1

    para débito Global; ◦ 1 modelo para crédito e 1 para débito para Cada cliente; ◦ ~60% da base possui seu próprio modelo. • Diminuição de custos ◦ ~90% em relação solução anterior. • Velocidade ◦ Treino: Cerca de 6hs (PARA TODA A BASE!); ◦ Predição: Milésimos de segundos; ◦ 3K: predições em média por minuto (set/19); ◦ 12K: pico de predições por minuto (set/19); • Solução: ◦ (Praticamente) Open-Source; ◦ Algoritmos simples e "padrões" (TF-IDF, XGBoost).
  43. 61.

    OBRIGADO • @gabubellon • gabubellon@gmail.com • gabriel.bellon@contaazul.com • http://gabubellon.me •

    https://jobs.kenoby.com/contaazul • http://python.joinville.br/ • http://dados.joinville.br/ • http://bit.ly/gabupybr15