Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Grafos em escala: Usando Titan, Faunus e Hadoop...
Search
Arthur Grava
March 30, 2016
Technology
0
140
Grafos em escala: Usando Titan, Faunus e Hadoop para recomendação de produtos
Arthur Grava
March 30, 2016
Tweet
Share
Other Decks in Technology
See All in Technology
Codex 5.3 と Opus 4.6 にコーポレートサイトを作らせてみた / Codex 5.3 vs Opus 4.6
ama_ch
0
220
usermode linux without MMU - fosdem2026 kernel devroom
thehajime
0
240
Context Engineeringが企業で不可欠になる理由
hirosatogamo
PRO
3
680
プロダクト成長を支える開発基盤とスケールに伴う課題
yuu26
4
1.4k
Agent Skils
dip_tech
PRO
0
140
[CV勉強会@関東 World Model 読み会] Orbis: Overcoming Challenges of Long-Horizon Prediction in Driving World Models (Mousakhan+, NeurIPS 2025)
abemii
0
150
Oracle AI Database移行・アップグレード勉強会 - RAT活用編
oracle4engineer
PRO
0
110
22nd ACRi Webinar - NTT Kawahara-san's slide
nao_sumikawa
0
110
【Ubie】AIを活用した広告アセット「爆速」生成事例 | AI_Ops_Community_Vol.2
yoshiki_0316
1
120
AIエージェントを開発しよう!-AgentCore活用の勘所-
yukiogawa
0
190
ClickHouseはどのように大規模データを活用したAIエージェントを全社展開しているのか
mikimatsumoto
0
270
20260204_Midosuji_Tech
takuyay0ne
1
160
Featured
See All Featured
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
77
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
220
GraphQLとの向き合い方2022年版
quramy
50
14k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
400
4 Signs Your Business is Dying
shpigford
187
22k
Git: the NoSQL Database
bkeepers
PRO
432
66k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
How STYLIGHT went responsive
nonsquared
100
6k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
Designing Experiences People Love
moore
144
24k
Side Projects
sachag
455
43k
Transcript
Grafos em escala Usando Titan, Faunus e Hadoop para recomendação
de produtos Arthur Grava Engenheiro Líder de Big Data @arthur_grava
[email protected]
• 786 lojas físicas • 8 centros de distribuição •
+18 mil colaboradores • +40 milhões de clientes • 16 milhões de visitantes únicos mês
Sistemas de recomendação
Sistemas de recomendação • Magazine Luiza • ~40k visitantes únicos
por hora • ~120k views em produtos por hora
Sistemas de recomendação
Sistemas de recomendação
Sistemas de recomendação
Sistemas de recomendação
Sistemas de recomendação
Grafos
Grafos • Conjunto de vértices
Grafos • Conjunto de vértices • Conjunto de arestas entre
vértices
Porque utilizar Grafos? • Modelagem simplificada • Abstração das relações
entre clientes e produtos • Facilidade em iterar nas entidades e seus relacionamentos • Facilidade para o cálculo de comportamentos básicos
Schema
Como representar dados em grafos?
Titan
Facilidades lidando com grafos • Titan, assim como outros bancos
/ frameworks, utilizam o Gremlin (DSL para grafos) • Facilita a escrita do código • Compatibilidade com outras plataformas
Facilidades lidando com grafos
Facilidades lidando com grafos
Facilidades lidando com grafos viu
Facilidades em cálculos simples
Facilidades em cálculos simples
Facilidades em cálculos simples
Facilidades em cálculos simples
Facilidades em cálculos simples SKU COUNT tv_2 1 tv_3 2
tv_4 3 tv_5 1
Facilidades em cálculos simples SKU COUNT tv_4 3 tv_3 2
tv_2 1 tv_5 1
Problemas?
Problemas...
Problemas...
Problemas... http://thinkaurelius.github.io/titan/wikidoc/0.4.4/Titan-Data-Model.html
Problemas... http://thinkaurelius.github.io/titan/wikidoc/0.4.4/Titan-Data-Model.html
Problemas... • Estávamos criando supernodes • Produtos muito populares causando
esse problema
Problemas... • Estávamos criando supernodes • Produtos muito populares causando
esse problema
Solução • Remodelagem do grafo • Manter arestas que podem
causar impacto por volume como unidirecionais
Mais problemas... • Não temos mais a aresta que de
produto para sessão!
Mais problemas... • Não temos mais a aresta que de
produto para sessão!
Stewie
• ~600 milhões de vértices • ~ 2.5 bilhões de
arestas • 1TB+ de dados • Tempo de resposta para uma query simples • 45ms • ~2500 read requests / sec • ~100 write requests / sec O quão grande?
Muito obrigado! Arthur Grava Engenheiro Líder de Big Data @arthur_grava
[email protected]
Perguntas? Arthur Grava Engenheiro Líder de Big Data @arthur_grava
[email protected]
None