Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Big Data na Globo.com
Search
Big Data Week São Paulo
November 23, 2015
Technology
0
43
Big Data na Globo.com
Renan Oliveira
Data Engineer @Globo.com
Big Data Week São Paulo
November 23, 2015
Tweet
Share
More Decks by Big Data Week São Paulo
See All by Big Data Week São Paulo
Os data lakes têm salvação? Uma perspectiva histórica e evolutiva
bdwsp
2
300
Expandindo suas habilidades de big data batch processing para streaming e multi-cloud
bdwsp
1
97
Turbo Science… Data science com sangue nos olhos
bdwsp
1
220
Arquitetura, tecnologias e desafios das plataformas de dados e busca da B2W Digital
bdwsp
0
150
Utilizando Alteryx para Self-Service Analytics e alavancagem de vendas
bdwsp
0
88
ARQUITETURAS DATA-CENTRIC: A evolução das arquiteturas que disseminam a cultura de dados nas organizações
bdwsp
0
81
Redescobrindo o Papel do Apache Kafka® em Arquiteturas de Dados Modernas
bdwsp
0
120
02-09_-_BDW_Wermans_Barros.pdf
bdwsp
0
130
Inovação & Disrupção – O quanto dados, analytics e novas tecnologias podem impactar seus negócios
bdwsp
0
58
Other Decks in Technology
See All in Technology
複数サービスを支えるマルチテナント型Batch MLプラットフォーム
lycorptech_jp
PRO
0
300
会社紹介資料 / Sansan Company Profile
sansan33
PRO
6
380k
Firestore → Spanner 移行 を成功させた段階的移行プロセス
athug
1
440
2025年になってもまだMySQLが好き
yoku0825
8
4.6k
初めてAWSを使うときのセキュリティ覚書〜初心者支部編〜
cmusudakeisuke
1
230
Snowflake Intelligenceにはこうやって立ち向かう!クラシルが考えるAI Readyなデータ基盤と活用のためのDataOps
gappy50
0
110
Snowflakeの生成AI機能を活用したデータ分析アプリの作成 〜Cortex AnalystとCortex Searchの活用とStreamlitアプリでの利用〜
nayuts
1
460
AIのグローバルトレンド2025 #scrummikawa / global ai trend
kyonmm
PRO
1
270
Django's GeneratedField by example - DjangoCon US 2025
pauloxnet
0
120
テストを軸にした生き残り術
kworkdev
PRO
0
190
オブザーバビリティが広げる AIOps の世界 / The World of AIOps Expanded by Observability
aoto
PRO
0
340
大「個人開発サービス」時代に僕たちはどう生きるか
sotarok
20
9.8k
Featured
See All Featured
Git: the NoSQL Database
bkeepers
PRO
431
66k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
GraphQLとの向き合い方2022年版
quramy
49
14k
Testing 201, or: Great Expectations
jmmastey
45
7.6k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.1k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
51
5.6k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
1.1k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
Statistics for Hackers
jakevdp
799
220k
Building Better People: How to give real-time feedback that sticks.
wjessup
368
19k
Designing Experiences People Love
moore
142
24k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Transcript
Big Data na globo.com Como estamos revolucionando com dados o
maior portal do Brasil @renan_oliveira
Como aprendemos os interesses dos usuários dado a sua navegação
Números • 3 bilhões de eventos diários • 50 milhões
de usuários únicos por mês • +100 mil novos conteúdos por mês
None
Páginas personalizadas são mais atrativas para os usuários
Social News
0 4 8 12 16 1 2 3 4 5
6 7 8 9 14.72 15.81 10.06 7.55 5.59 4.05 4.28 5.37 13.07 3.04 3.06 3.01 2.93 2.92 3 2.85 3.02 3.13 All Visits Social News Users Métricas
None
None
Veracidade Variedade Valor Velocidade Volume
None
• Lambda: Streaming + Batch • APIs com tempo de
resposta em ms • Ferramentas de analise de dados • Map Reduce está morto :) Arquitetura
None
Frentes de ação • Recomendação • Conhecimento sobre o usuário
• Plataforma de dados
None
None
13.2% feed editorial Maior diversidade feed recomendado 100% *matérias que
foram para o feed
*Dados extraídos em novembro de 2015
*Dados extraídos em novembro de 2015
Algoritmos • Collaborative Filtering • Content-Based • ALS
None
None
None
None
Spreading Activation
*Quando usuário leu alguma matéria sobre seu time teste off-line
com 3.5M de usuários da base 82% de acerto 95% de acerto nas 3 primeiras posições Qual o seu time?
teste com 500M de impressões +48.1% +48.4% com spreading activation
de conversão Resultado do teste A/B *Dados extraídos em novembro de 2015
Data Culture
• Métricas por todo lado • Cálculo de engajamento •
Business Intelligence Saindo da fronteira da área
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data…
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana Jupyter
• Métricas das Aplicações • Exploration and Visualization • Data
Discovery Data… Grafana Jupyter
None
Obrigado renanoliveira.net