Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Raspagem de dados com Puppeteer

Raspagem de dados com Puppeteer

Diego Leite

January 19, 2019
Tweet

More Decks by Diego Leite

Other Decks in Programming

Transcript

  1. • Introdução ao problema • O que é o puppeteer?

    • Como o puppeteer funciona? • Alguns Exemplos • Demo • Conclusões ROTEIRO @di3goleite
  2. PUPPETEER @di3goleite • É uma biblioteca para Node que fornece

    uma API de alto nível para controlar o Chrome ou Chromium através do DevTools Protocol • Ele roda por padrão de forma headless mas pode ser configurado para executar com interface gráfica
  3. COMO O PUPPETEER FUNCIONA? @di3goleite * CDP = Chrome DevTools

    Protocol $ npm install puppeteer $ npm install puppeteer-core
  4. CONCLUSÕES @di3goleite • Sempre remova a opção headless: false ao

    colocar em produção • Sempre fique atento (a) ao rate limit da página que você está raspando