Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Big Data na Globo.com
Search
Big Data Week São Paulo
November 23, 2015
Technology
0
45
Big Data na Globo.com
Renan Oliveira
Data Engineer @Globo.com
Big Data Week São Paulo
November 23, 2015
Tweet
Share
More Decks by Big Data Week São Paulo
See All by Big Data Week São Paulo
Os data lakes têm salvação? Uma perspectiva histórica e evolutiva
bdwsp
2
310
Expandindo suas habilidades de big data batch processing para streaming e multi-cloud
bdwsp
1
100
Turbo Science… Data science com sangue nos olhos
bdwsp
1
220
Arquitetura, tecnologias e desafios das plataformas de dados e busca da B2W Digital
bdwsp
0
150
Utilizando Alteryx para Self-Service Analytics e alavancagem de vendas
bdwsp
0
90
ARQUITETURAS DATA-CENTRIC: A evolução das arquiteturas que disseminam a cultura de dados nas organizações
bdwsp
0
83
Redescobrindo o Papel do Apache Kafka® em Arquiteturas de Dados Modernas
bdwsp
0
120
02-09_-_BDW_Wermans_Barros.pdf
bdwsp
0
130
Inovação & Disrupção – O quanto dados, analytics e novas tecnologias podem impactar seus negócios
bdwsp
0
59
Other Decks in Technology
See All in Technology
[Data & AI Summit '25 Fall] AIでデータ活用を進化させる!Google Cloudで作るデータ活用の未来
kirimaru
0
4.2k
戰略轉變:從建構 AI 代理人到發展可擴展的技能生態系統
appleboy
0
180
純粋なイミュータブルモデルを設計してからイベントソーシングと組み合わせるDeciderの実践方法の紹介 /Introducing Decider Pattern with Event Sourcing
tomohisa
1
130
製造業から学んだ「本質を守り現場に合わせるアジャイル実践」
kamitokusari
0
120
Agentic AIが変革するAWSの開発・運用・セキュリティ ~Frontier Agentsを試してみた~ / Agentic AI transforms AWS development, operations, and security I tried Frontier Agents
yuj1osm
0
190
re:Invent2025 セッションレポ ~Spec-driven development with Kiro~
nrinetcom
PRO
2
170
AIと融ける人間の冒険
pujisi
0
110
AWS re:Invent2025最新動向まとめ(NRIグループre:Cap 2025)
gamogamo
0
150
プロンプトエンジニアリングを超えて:自由と統制のあいだでつくる Platform × Context Engineering
yuriemori
0
110
Digitization部 紹介資料
sansan33
PRO
1
6.4k
AI時代のアジャイルチームを目指して ー スクラムというコンフォートゾーンからの脱却 ー / Toward Agile Teams in the Age of AI
takaking22
8
2k
モノタロウ x クリエーションラインで実現する チームトポロジーにおける プラットフォームチーム・ ストリームアラインドチームの 効果的なコラボレーション
creationline
0
280
Featured
See All Featured
The Limits of Empathy - UXLibs8
cassininazir
1
200
Documentation Writing (for coders)
carmenintech
77
5.2k
Building the Perfect Custom Keyboard
takai
2
670
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
200
Measuring & Analyzing Core Web Vitals
bluesmoon
9
720
The agentic SEO stack - context over prompts
schlessera
0
580
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
98
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
0
220
GraphQLとの向き合い方2022年版
quramy
50
14k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
2
76
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
Transcript
Big Data na globo.com Como estamos revolucionando com dados o
maior portal do Brasil @renan_oliveira
Como aprendemos os interesses dos usuários dado a sua navegação
Números • 3 bilhões de eventos diários • 50 milhões
de usuários únicos por mês • +100 mil novos conteúdos por mês
None
Páginas personalizadas são mais atrativas para os usuários
Social News
0 4 8 12 16 1 2 3 4 5
6 7 8 9 14.72 15.81 10.06 7.55 5.59 4.05 4.28 5.37 13.07 3.04 3.06 3.01 2.93 2.92 3 2.85 3.02 3.13 All Visits Social News Users Métricas
None
None
Veracidade Variedade Valor Velocidade Volume
None
• Lambda: Streaming + Batch • APIs com tempo de
resposta em ms • Ferramentas de analise de dados • Map Reduce está morto :) Arquitetura
None
Frentes de ação • Recomendação • Conhecimento sobre o usuário
• Plataforma de dados
None
None
13.2% feed editorial Maior diversidade feed recomendado 100% *matérias que
foram para o feed
*Dados extraídos em novembro de 2015
*Dados extraídos em novembro de 2015
Algoritmos • Collaborative Filtering • Content-Based • ALS
None
None
None
None
Spreading Activation
*Quando usuário leu alguma matéria sobre seu time teste off-line
com 3.5M de usuários da base 82% de acerto 95% de acerto nas 3 primeiras posições Qual o seu time?
teste com 500M de impressões +48.1% +48.4% com spreading activation
de conversão Resultado do teste A/B *Dados extraídos em novembro de 2015
Data Culture
• Métricas por todo lado • Cálculo de engajamento •
Business Intelligence Saindo da fronteira da área
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data…
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana Jupyter
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana Jupyter
None
Obrigado renanoliveira.net