Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Raspagem de dados com Puppeteer
Search
Diego Leite
January 19, 2019
Programming
180
0
Share
Raspagem de dados com Puppeteer
Diego Leite
January 19, 2019
More Decks by Diego Leite
See All by Diego Leite
Aprenda a fazer um site responsivo
di3goleite
0
54
Não deixe a Universidade atrapalhar seus ESTUDOS
di3goleite
0
50
Ferramentas "Mão na Roda" para ajudar nos projetos de vocês
di3goleite
0
64
Rodando aplicações de interface gráfica com Docker
di3goleite
0
700
Programação Assíncrona com JavaScript
di3goleite
0
76
Explore o mundo do IoT com o MATRIX Creator - Front In Salvador
di3goleite
0
81
Introdução ao React Native
di3goleite
0
170
eXtreme Go Horse (XGH)
di3goleite
0
790
Explore o mundo do IoT com o MATRIX Creator
di3goleite
0
120
Other Decks in Programming
See All in Programming
ローカルで稼働するAI エージェントを超えて / beyond-local-ai-agents
gawa
1
230
それはエンジニアリングの糧である:AI開発のためにAIのOSSを開発する現場より / It serves as fuel for engineering: insights from the field of developing open-source AI for AI development.
nrslib
1
820
20260315 AWSなんもわからん🥲
chiilog
2
180
Java 21/25 Virtual Threads 소개
debop
0
320
夢の無限スパゲッティ製造機 -実装篇- #phpstudy
o0h
PRO
0
180
見せてもらおうか、 OpenSearchの性能とやらを!
shunta27
1
170
AWS×クラウドネイティブソフトウェア設計 / AWS x Cloud-Native Software Design
nrslib
16
3.5k
Cyrius ーLinux非依存にコンテナをネイティブ実行する専用OSー
n4mlz
0
270
Linux Kernelの1文字のミスで 権限昇格ができた話
rqda
0
2.2k
野球解説AI Agentを開発してみた - 2026/02/27 LayerX社内LT会資料
shinyorke
PRO
0
380
Xdebug と IDE による デバッグ実行の仕組みを見る / Exploring-How-Debugging-Works-with-Xdebug-and-an-IDE
shin1x1
0
300
メッセージングを利用して時間的結合を分離しよう #phperkaigi
kajitack
3
530
Featured
See All Featured
Bash Introduction
62gerente
615
210k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
92
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
350
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
500
The Curious Case for Waylosing
cassininazir
0
280
Navigating Team Friction
lara
192
16k
The browser strikes back
jonoalderson
0
870
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
120
Writing Fast Ruby
sferik
630
63k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9k
Amusing Abliteration
ianozsvald
1
150
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Transcript
RASPAGEM DE DADOS COM PUPPETEER @di3goleite
DIEGO LEITE AdMobilize UEFS @di3goleite
@di3goleite
@di3goleite
• Introdução ao problema • O que é o puppeteer?
• Como o puppeteer funciona? • Alguns Exemplos • Demo • Conclusões ROTEIRO @di3goleite
INTRODUÇÃO AO PROBLEMA @di3goleite
INTRODUÇÃO AO PROBLEMA @di3goleite
INTRODUÇÃO AO PROBLEMA @di3goleite
INTRODUÇÃO AO PROBLEMA @di3goleite
PUPPETEER @di3goleite • É uma biblioteca para Node que fornece
uma API de alto nível para controlar o Chrome ou Chromium através do DevTools Protocol • Ele roda por padrão de forma headless mas pode ser configurado para executar com interface gráfica
COMO O PUPPETEER FUNCIONA? @di3goleite * CDP = Chrome DevTools
Protocol $ npm install puppeteer $ npm install puppeteer-core
PUPPETEER - SCREENSHOT @di3goleite
PUPPETEER - SCREENSHOT @di3goleite
PUPPETEER - LOGIN TO GITHUB @di3goleite
PUPPETEER - LOGIN TO GITHUB @di3goleite
PUPPETEER - LOGIN TO GITHUB @di3goleite
PUPPETEER - LOGIN TO GITHUB @di3goleite
PUPPETEER - LOGIN TO GITHUB @di3goleite
DEMO \o/ @di3goleite
CONCLUSÕES @di3goleite • Sempre remova a opção headless: false ao
colocar em produção • Sempre fique atento (a) ao rate limit da página que você está raspando
PERGUNTAS? Twitter e GitHub @di3goleite @di3goleite
OBRIGADO! @di3goleite