Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Streamingdatenstrukturen zum Analysieren von Nu...
Search
Torsten Bøgh Köster
November 03, 2015
Technology
910
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Streamingdatenstrukturen zum Analysieren von Nutzeraktionen in Echtzeit
Torsten Bøgh Köster
November 03, 2015
More Decks by Torsten Bøgh Köster
See All by Torsten Bøgh Köster
LLMs im Griff: Observability, Tracing und Security
tboeghk
0
32
LLMs im Griff: Observability, Tracing und Security
tboeghk
0
48
Oder mache ich es lieber selbst? Wie sich Kosten und Geopolitik auf Cloud-Betrieb auswirken
tboeghk
0
55
Taking an abandoned Solr search from zero to GenAI hero
tboeghk
0
59
Oder mache ich es lieber selbst? Wie sich Kosten und Geopolitik auf Cloud-Betrieb auswirken
tboeghk
0
56
🔪 How we cut our AWS costs in half
tboeghk
0
400
Shared Nothing Logging Infrastructure
tboeghk
0
130
Beyond Cloud: A road trip into AWS and back to bare metal
tboeghk
1
120
Shared Nothing Logging Infrastructure
tboeghk
0
1.4k
Other Decks in Technology
See All in Technology
Bucharest Tech Week 2026 - Guardians of the Cloud-Native Galaxy
edeandrea
PRO
0
130
20260619 私の日常業務での生成 AI 活用
masaruogura
1
240
AIのReact習熟度を測る
uhyo
2
670
iOS アプリの「これって不具合ですか?」を AI に調べてもらう
miichan
0
130
自宅LLMの話
jacopen
1
700
SONiCのLinuxベースを活かしたZabbix監視
sonic
0
260
SONiCで構築・運用する生成AI向けパブリッククラウドネットワーク ~実装編~
sonic
0
320
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
450
AI-DLCを “そのまま導入しなかった”話 ~組織に合わせてアジャストした 私たちの実践共有~
hiroramos4
PRO
1
370
ザ・データベース、MySQL ~ OSC 2026 Sendai ~
sakaik
0
170
WebGIS AI Agentの紹介
_shimizu
0
250
SONiCの統計情報を取得したい
sonic
0
270
Featured
See All Featured
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
210
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
270
Odyssey Design
rkendrick25
PRO
2
700
Chasing Engaging Ingredients in Design
codingconduct
0
220
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
440
Faster Mobile Websites
deanohume
310
32k
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.7k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
180
Designing Experiences People Love
moore
143
24k
How GitHub (no longer) Works
holman
316
150k
Transcript
Streamingdatenstrukturen zum Analysieren von Nutzeraktionen in Echtzeit WJAX 2015 Torsten
Bøgh Köster (Shopping24) 3. November 2015
Agenda
@tboeghk CTO shopping24 internet group Search Technology Meetup Hamburg Search,
build, delivery, code quality, road bike
None
Open Source Power. Delivered.
search system @ shopping24
Anwendungsfall 1
Produkte gezielt löschen
Bloomfilter
Funktionsweise Bloomfilter
Lokale Bloomfilter
Anwendungsfall 2
Relevante Produkte je Suchanfrage
Benutzeraktionen einfangen
Benutzeraktionen verarbeiten
None
You cannot scale into real time!
Stream Mining
Logstash FTW!
Popularitätswerte als Rankingfaktor
Mit Mandanten exponentielle Datenpunkte
None
The Count-Min-Sketch: A Bloomfilter on Steroids
Wie geht das?
None
Relevanz von Datenpunkten im zeitlichen Verlauf
Exponential Decay
Punisher.java
Anwendungsfall 3
Populäre Suchen in der Autocompletion boosten
Heavy Hitters a.k.a. TopK
Und so geht’s
Und sonst so?
BitSet / SparseFixedBitSet: Non-probabilistic existence test
HyperLogLog: Estimating cardinality
Data Sampling: Reduce large data sets using statistics. Use for:
expensive computations
Data Sampling: Existence computation reduces large data sets to constant
~700pcs
Packed Ints: Reduce heap size for large integer arrays
Packed Ints: Further heap reduction with an offset
None
@see ‣T-Digest (Ted Dunning): https:// www.mapr.com/blog/better-anomaly- detection-t-digest-whiteboard- walkthrough ‣Realtime personalization
(Mikio Braun): http:// blog.mikiobraun.de/2014/05/bbuzz- realtime-personalization- recommendation-stream-mining.html ‣Algorithms and data structures that power Lucene and Solr (Adrien Grand): http:// berlinbuzzwords.de/session/ algorithms-and-data-structures- power-lucene-and-elasticsearch ‣HypeLogLog in Reds: http:// redis.io/commands#hyperloglog ‣Sketching & Scaling Series: http://blog.kiip.me/engineering/ sketching-scaling-part-1-what- the-is-sketching/
Questions? @tboeghk developer.s24.com
[email protected]