Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Raspagem de dados com Puppeteer
Search
Diego Leite
January 19, 2019
Programming
0
180
Raspagem de dados com Puppeteer
Diego Leite
January 19, 2019
Tweet
Share
More Decks by Diego Leite
See All by Diego Leite
Aprenda a fazer um site responsivo
di3goleite
0
51
Não deixe a Universidade atrapalhar seus ESTUDOS
di3goleite
0
50
Ferramentas "Mão na Roda" para ajudar nos projetos de vocês
di3goleite
0
61
Rodando aplicações de interface gráfica com Docker
di3goleite
0
690
Programação Assíncrona com JavaScript
di3goleite
0
74
Explore o mundo do IoT com o MATRIX Creator - Front In Salvador
di3goleite
0
79
Introdução ao React Native
di3goleite
0
170
eXtreme Go Horse (XGH)
di3goleite
0
770
Explore o mundo do IoT com o MATRIX Creator
di3goleite
0
120
Other Decks in Programming
See All in Programming
AI によるインシデント初動調査の自動化を行う AI インシデントコマンダーを作った話
azukiazusa1
1
750
Automatic Grammar Agreementと Markdown Extended Attributes について
kishikawakatsumi
0
200
なるべく楽してバックエンドに型をつけたい!(楽とは言ってない)
hibiki_cube
0
140
CSC307 Lecture 05
javiergs
PRO
0
500
[KNOTS 2026登壇資料]AIで拡張‧交差する プロダクト開発のプロセス および携わるメンバーの役割
hisatake
0
300
「ブロックテーマでは再現できない」は本当か?
inc2734
0
1k
CSC307 Lecture 07
javiergs
PRO
1
560
AIによるイベントストーミング図からのコード生成 / AI-powered code generation from Event Storming diagrams
nrslib
2
1.9k
CSC307 Lecture 08
javiergs
PRO
0
670
カスタマーサクセス業務を変革したヘルススコアの実現と学び
_hummer0724
0
730
SourceGeneratorのススメ
htkym
0
200
CSC307 Lecture 09
javiergs
PRO
1
840
Featured
See All Featured
Building Adaptive Systems
keathley
44
2.9k
The SEO Collaboration Effect
kristinabergwall1
0
350
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
140
The Cult of Friendly URLs
andyhume
79
6.8k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
460
Darren the Foodie - Storyboard
khoart
PRO
2
2.4k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
94
The Mindset for Success: Future Career Progression
greggifford
PRO
0
240
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
340
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.9k
How to Think Like a Performance Engineer
csswizardry
28
2.5k
Transcript
RASPAGEM DE DADOS COM PUPPETEER @di3goleite
DIEGO LEITE AdMobilize UEFS @di3goleite
@di3goleite
@di3goleite
• Introdução ao problema • O que é o puppeteer?
• Como o puppeteer funciona? • Alguns Exemplos • Demo • Conclusões ROTEIRO @di3goleite
INTRODUÇÃO AO PROBLEMA @di3goleite
INTRODUÇÃO AO PROBLEMA @di3goleite
INTRODUÇÃO AO PROBLEMA @di3goleite
INTRODUÇÃO AO PROBLEMA @di3goleite
PUPPETEER @di3goleite • É uma biblioteca para Node que fornece
uma API de alto nível para controlar o Chrome ou Chromium através do DevTools Protocol • Ele roda por padrão de forma headless mas pode ser configurado para executar com interface gráfica
COMO O PUPPETEER FUNCIONA? @di3goleite * CDP = Chrome DevTools
Protocol $ npm install puppeteer $ npm install puppeteer-core
PUPPETEER - SCREENSHOT @di3goleite
PUPPETEER - SCREENSHOT @di3goleite
PUPPETEER - LOGIN TO GITHUB @di3goleite
PUPPETEER - LOGIN TO GITHUB @di3goleite
PUPPETEER - LOGIN TO GITHUB @di3goleite
PUPPETEER - LOGIN TO GITHUB @di3goleite
PUPPETEER - LOGIN TO GITHUB @di3goleite
DEMO \o/ @di3goleite
CONCLUSÕES @di3goleite • Sempre remova a opção headless: false ao
colocar em produção • Sempre fique atento (a) ao rate limit da página que você está raspando
PERGUNTAS? Twitter e GitHub @di3goleite @di3goleite
OBRIGADO! @di3goleite