Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Big Data na Globo.com
Search
Big Data Week São Paulo
November 23, 2015
Technology
0
44
Big Data na Globo.com
Renan Oliveira
Data Engineer @Globo.com
Big Data Week São Paulo
November 23, 2015
Tweet
Share
More Decks by Big Data Week São Paulo
See All by Big Data Week São Paulo
Os data lakes têm salvação? Uma perspectiva histórica e evolutiva
bdwsp
2
300
Expandindo suas habilidades de big data batch processing para streaming e multi-cloud
bdwsp
1
99
Turbo Science… Data science com sangue nos olhos
bdwsp
1
220
Arquitetura, tecnologias e desafios das plataformas de dados e busca da B2W Digital
bdwsp
0
150
Utilizando Alteryx para Self-Service Analytics e alavancagem de vendas
bdwsp
0
90
ARQUITETURAS DATA-CENTRIC: A evolução das arquiteturas que disseminam a cultura de dados nas organizações
bdwsp
0
83
Redescobrindo o Papel do Apache Kafka® em Arquiteturas de Dados Modernas
bdwsp
0
120
02-09_-_BDW_Wermans_Barros.pdf
bdwsp
0
130
Inovação & Disrupção – O quanto dados, analytics e novas tecnologias podem impactar seus negócios
bdwsp
0
58
Other Decks in Technology
See All in Technology
re:Invent 2025の見どころと便利アイテムをご紹介 / Highlights and Useful Items for re:Invent 2025
yuj1osm
0
650
AIがコードを書いてくれるなら、新米エンジニアは何をする? / komekaigi2025
nkzn
24
17k
新米エンジニアをTech Leadに任命する ー 成長を支える挑戦的な人と組織のマネジメント
naopr
1
350
Spec Driven Development入門/spec_driven_development_for_learners
hanhan1978
0
210
GPUをつかってベクトル検索を扱う手法のお話し~NVIDIA cuVSとCAGRA~
fshuhe
0
370
データエンジニアとして生存するために 〜界隈を盛り上げる「お祭り」が必要な理由〜 / data_summit_findy_Session_1
sansan_randd
1
920
次世代のメールプロトコルの斜め読み
hirachan
3
330
短期間でRAGシステムを実現 お客様と歩んだ生成AI内製化への道のり
taka0709
1
170
SREのキャリアから経営に近づく - Enterprise Risk Managementを基に -
shonansurvivors
1
720
GCASアップデート(202508-202510)
techniczna
0
260
[Journal club] Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces
keio_smilab
PRO
0
110
現場の壁を乗り越えて、 「計装注入」が拓く オブザーバビリティ / Beyond the Field Barriers: Instrumentation Injection and the Future of Observability
aoto
PRO
1
900
Featured
See All Featured
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Automating Front-end Workflow
addyosmani
1371
200k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
650
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
What's in a price? How to price your products and services
michaelherold
246
12k
Building a Scalable Design System with Sketch
lauravandoore
463
33k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.5k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.3k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
Transcript
Big Data na globo.com Como estamos revolucionando com dados o
maior portal do Brasil @renan_oliveira
Como aprendemos os interesses dos usuários dado a sua navegação
Números • 3 bilhões de eventos diários • 50 milhões
de usuários únicos por mês • +100 mil novos conteúdos por mês
None
Páginas personalizadas são mais atrativas para os usuários
Social News
0 4 8 12 16 1 2 3 4 5
6 7 8 9 14.72 15.81 10.06 7.55 5.59 4.05 4.28 5.37 13.07 3.04 3.06 3.01 2.93 2.92 3 2.85 3.02 3.13 All Visits Social News Users Métricas
None
None
Veracidade Variedade Valor Velocidade Volume
None
• Lambda: Streaming + Batch • APIs com tempo de
resposta em ms • Ferramentas de analise de dados • Map Reduce está morto :) Arquitetura
None
Frentes de ação • Recomendação • Conhecimento sobre o usuário
• Plataforma de dados
None
None
13.2% feed editorial Maior diversidade feed recomendado 100% *matérias que
foram para o feed
*Dados extraídos em novembro de 2015
*Dados extraídos em novembro de 2015
Algoritmos • Collaborative Filtering • Content-Based • ALS
None
None
None
None
Spreading Activation
*Quando usuário leu alguma matéria sobre seu time teste off-line
com 3.5M de usuários da base 82% de acerto 95% de acerto nas 3 primeiras posições Qual o seu time?
teste com 500M de impressões +48.1% +48.4% com spreading activation
de conversão Resultado do teste A/B *Dados extraídos em novembro de 2015
Data Culture
• Métricas por todo lado • Cálculo de engajamento •
Business Intelligence Saindo da fronteira da área
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data…
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana Jupyter
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana Jupyter
None
Obrigado renanoliveira.net