Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Big Data na Globo.com
Search
Big Data Week São Paulo
November 23, 2015
Technology
0
45
Big Data na Globo.com
Renan Oliveira
Data Engineer @Globo.com
Big Data Week São Paulo
November 23, 2015
Tweet
Share
More Decks by Big Data Week São Paulo
See All by Big Data Week São Paulo
Os data lakes têm salvação? Uma perspectiva histórica e evolutiva
bdwsp
2
310
Expandindo suas habilidades de big data batch processing para streaming e multi-cloud
bdwsp
1
100
Turbo Science… Data science com sangue nos olhos
bdwsp
1
230
Arquitetura, tecnologias e desafios das plataformas de dados e busca da B2W Digital
bdwsp
0
160
Utilizando Alteryx para Self-Service Analytics e alavancagem de vendas
bdwsp
0
91
ARQUITETURAS DATA-CENTRIC: A evolução das arquiteturas que disseminam a cultura de dados nas organizações
bdwsp
0
88
Redescobrindo o Papel do Apache Kafka® em Arquiteturas de Dados Modernas
bdwsp
0
120
02-09_-_BDW_Wermans_Barros.pdf
bdwsp
0
130
Inovação & Disrupção – O quanto dados, analytics e novas tecnologias podem impactar seus negócios
bdwsp
0
60
Other Decks in Technology
See All in Technology
Azure Durable Functions で作った NL2SQL Agent の精度向上に取り組んだ話/jat08
thara0402
0
180
生成AI時代にこそ求められるSRE / SRE for Gen AI era
ymotongpoo
5
3.2k
SREチームをどう作り、どう育てるか ― Findy横断SREのマネジメント
rvirus0817
0
250
顧客との商談議事録をみんなで読んで顧客解像度を上げよう
shibayu36
0
230
Cosmos World Foundation Model Platform for Physical AI
takmin
0
890
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
usermode linux without MMU - fosdem2026 kernel devroom
thehajime
0
230
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.3k
クレジットカード決済基盤を支えるSRE - 厳格な監査とSRE運用の両立 (SRE Kaigi 2026)
capytan
6
2.7k
20260204_Midosuji_Tech
takuyay0ne
1
150
Embedded SREの終わりを設計する 「なんとなく」から計画的な自立支援へ
sansantech
PRO
3
2.4k
AI駆動PjMの理想像 と現在地 -実践例を添えて-
masahiro_okamura
1
110
Featured
See All Featured
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
410
A Tale of Four Properties
chriscoyier
162
24k
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
280
Evolving SEO for Evolving Search Engines
ryanjones
0
120
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
110
Accessibility Awareness
sabderemane
0
51
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
The agentic SEO stack - context over prompts
schlessera
0
640
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
190
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
310
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Transcript
Big Data na globo.com Como estamos revolucionando com dados o
maior portal do Brasil @renan_oliveira
Como aprendemos os interesses dos usuários dado a sua navegação
Números • 3 bilhões de eventos diários • 50 milhões
de usuários únicos por mês • +100 mil novos conteúdos por mês
None
Páginas personalizadas são mais atrativas para os usuários
Social News
0 4 8 12 16 1 2 3 4 5
6 7 8 9 14.72 15.81 10.06 7.55 5.59 4.05 4.28 5.37 13.07 3.04 3.06 3.01 2.93 2.92 3 2.85 3.02 3.13 All Visits Social News Users Métricas
None
None
Veracidade Variedade Valor Velocidade Volume
None
• Lambda: Streaming + Batch • APIs com tempo de
resposta em ms • Ferramentas de analise de dados • Map Reduce está morto :) Arquitetura
None
Frentes de ação • Recomendação • Conhecimento sobre o usuário
• Plataforma de dados
None
None
13.2% feed editorial Maior diversidade feed recomendado 100% *matérias que
foram para o feed
*Dados extraídos em novembro de 2015
*Dados extraídos em novembro de 2015
Algoritmos • Collaborative Filtering • Content-Based • ALS
None
None
None
None
Spreading Activation
*Quando usuário leu alguma matéria sobre seu time teste off-line
com 3.5M de usuários da base 82% de acerto 95% de acerto nas 3 primeiras posições Qual o seu time?
teste com 500M de impressões +48.1% +48.4% com spreading activation
de conversão Resultado do teste A/B *Dados extraídos em novembro de 2015
Data Culture
• Métricas por todo lado • Cálculo de engajamento •
Business Intelligence Saindo da fronteira da área
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data…
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana Jupyter
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana Jupyter
None
Obrigado renanoliveira.net