Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Streamingdatenstrukturen zum Analysieren von Nu...
Search
Torsten Bøgh Köster
May 20, 2016
Technology
0
45
Streamingdatenstrukturen zum Analysieren von Nutzeraktionen in Echtzeit (Otto Group BI Streaming Round Table)
A newer and more recent version of the talk held at WJAX 2015.
Torsten Bøgh Köster
May 20, 2016
Tweet
Share
More Decks by Torsten Bøgh Köster
See All by Torsten Bøgh Köster
Taking an abandoned Solr search from zero to GenAI hero
tboeghk
0
15
Oder mache ich es lieber selbst? Wie sich Kosten und Geopolitik auf Cloud-Betrieb auswirken
tboeghk
0
34
🔪 How we cut our AWS costs in half
tboeghk
0
250
Shared Nothing Logging Infrastructure
tboeghk
0
120
Beyond Cloud: A road trip into AWS and back to bare metal
tboeghk
1
100
Shared Nothing Logging Infrastructure
tboeghk
0
1.3k
Kubernetes the ❤️ way
tboeghk
0
1k
Beyond Cloud: A road trip into AWS and back to bare metal
tboeghk
0
100
Open-Source-Logging und -Monitoring (W-JAX 2017)
tboeghk
0
98
Other Decks in Technology
See All in Technology
Datasets for Critical Operations by Dataform
kimujun
0
120
robocopy の怖い話/scary-story-about-robocopy
emiki
0
410
[MIRU25] NaiLIA: Multimodal Retrieval of Nail Designs Based on Dense Intent Descriptions
keio_smilab
PRO
1
140
自分がLinc’wellで提供しているプロダクトを理解するためにやったこと
murabayashi
1
170
LLMでAI-OCR、実際どうなの? / llm_ai_ocr_layerx_bet_ai_day_lt
sbrf248
0
260
分散トレーシングによる コネクティッドカーのデータ処理見える化の試み
thatsdone
0
270
ユーザー理解の爆速化とPdMの価値
kakehashi
PRO
1
110
大規模イベントを支える ABEMA の アーキテクチャ 変遷 2025
nagapad
5
540
Tiptapで実現する堅牢で柔軟なエディター開発
kirik
1
160
Snowflake のアーキテクチャは本当に筋がよかったのか / Data Engineering Study #30
indigo13love
0
290
Step Functions First - サーバーレスアーキテクチャの新しいパラダイム
taikis
1
280
【CEDEC2025】現場を理解して実現!ゲーム開発を効率化するWebサービスの開発と、利用促進のための継続的な改善
cygames
PRO
0
410
Featured
See All Featured
The Straight Up "How To Draw Better" Workshop
denniskardys
235
140k
Faster Mobile Websites
deanohume
308
31k
Writing Fast Ruby
sferik
628
62k
Art, The Web, and Tiny UX
lynnandtonic
301
21k
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.5k
Building a Modern Day E-commerce SEO Strategy
aleyda
42
7.4k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
21k
Mobile First: as difficult as doing things right
swwweet
223
9.7k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.6k
Building Adaptive Systems
keathley
43
2.7k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
Transcript
Streamingdatenstrukturen zum Analysieren von Nutzeraktionen in Echtzeit Otto Streaming Round
Table 2016 Torsten Bøgh Köster (Shopping24) 19. Mai 2016
Agenda
@tboeghk CTO shopping24 internet group Search Technology Meetup Hamburg Search,
build, delivery, code quality, road bike
None
Open Source Power. Delivered.
search system @ shopping24
Anwendungsfall 1
Sucharchitektur
Produktbefüllung
Keine Index-Updates zur Prime Time
Verfügbarkeit aktualisieren
Verfügbarkeit von 1,5 Mrd. Produkten?
Bloomfilter
Funktionsweise Bloomfilter
Lokale Bloomfilter
Anwendungsfall 2
Relevante Produkte je Suchanfrage
Benutzeraktionen einfangen
Benutzeraktionen verarbeiten
None
You cannot scale into real time!
Stream Mining
Logstash FTW!
Popularitätswerte als Rankingfaktor
Mit Mandanten exponentielle Datenpunkte
None
The Count-Min-Sketch: A Bloomfilter on Steroids
Wie geht das?
None
Relevanz von Datenpunkten im zeitlichen Verlauf
Exponential Decay
Punisher.java
Anwendungsfall 3
Populäre Suchen in der Autocompletion boosten
Heavy Hitters a.k.a. TopK
Und so geht’s
None
None
None
Questions? @tboeghk developer.s24.com
[email protected]