Slide 18
Slide 18 text
Functional Architecture
Strange Events
Ingestion
Raw Event
Stream
Collection Events Processing Analytics
Warehouse
Fact
Entries
Atomic Event
Frames
Data Lake
Master Data Integration
§ Buffers load peeks
§ Ensures message
delivery (fire & forget
for client)
§ Create user journeys and
unique user sets
§ Enrich dimensions
§ Aggregate events to KPIs
§ Ability to replay for schema
evolution
§ The representation of truth
§ Multidimensional data
model
§ Interactive queries for
actions in realtime and
data exploration
§ Eternal memory for all
events (even strange
ones)
§ One schema per event
type. Time partitioned.
class Analytics Model
´ factª
WebFact
´ dimensionª
Zeit
´ dimensionª
Kampagne
Jahr
Quartal
Monat
Woche
Tag
Stunde
Minute
Kunde
+ Land: String
Partner
´ dimensionª
Tracking
Tracking Group
SensorTag
+ Typ: SensorTagType
Platzierung
+ Format: ImageSize
+ Kostenmodell: KostenmodellArt
Werbemittel
+ AdGroup: String
+ Format: ImageSize
+ Grˆ fle: KiloBytes
+ LandingPage: URL
+ Motif: URL
Kampagne
´ dimensionª
Client
Kategorie
Dev ice
+ Bezeichner: String
+ Hersteller: String
+ Typ: String
Brow ser
+ Typ: String
+ Version: int
´ dimensionª
Ausspielort
Land
Region
Stadt
´ dimensionª
Kanal
Kanal
´ dimensionª
Vermarktung
´ enumerationª
SensorTagType
ORDER_TAG
MASTER_TAG
CUSTOM_TAG
Betriebssystem
+ Typ: String
+ Version: Version
? Dimension: Unabh‰
ng ig es Pr‰
dikat auf Metriken bei der Analyse ("kann isoliert dar¸ ber nachdenken / isoliert dazu Analysen
fahren")
? H ierarchie: Sub-Pr‰
dikat auf Metriken. Erzeug t mehr als eine (zueinander diskunkte) Teilmeng en der Metriken. Entspricht den g ‰
ng ig en
Drill-Down-Pfaden in den Reports bzw. den Batch-Ag g reg ate-Up-Pfaden in der Ag g reg ationslog ik. Semantische Unterstrukturen: "ist Teil
von & kann nicht existieren ohne".
? Asssoziation: Nicht verwendet. Separates Stammdatenmodell.
? Attribut: Ermˆ g licht eine weitere (querschneidende) Einschr‰
nkung der Metrikmeng e erg ‰
nzend zu den Hierarchien.
Domain
Website
Tracking Site
Vermarkter
Auslieferungs-
Domain
Referral
´ enumerati...
KostenmodellArt
CPC
CPM
CPO
CPA
´ abstractª
DimensionValue
+ id: int
+ name: String
+ sourceId: String
WebsiteFact
+ Bounces: int
+ Verweildauer: float
+ Visits: int
BasicAdFact
+ Clicks: int
+ Sichtbare Views: int
+ Validierte Clicks: int
+ View (angefragt): int
+ View (ausgeliefert): int
+ View (gemessen): int
´ dimensionª
Produkt
Shop
Produkt
+ Produktkategorie: String
´ dimensionª
Zeitfenster
Letzte X Tage
´ dimensionª
User
User Segment
´ dimensionª
Order
OrderStatus
+ Status: OrderStatus
´ enumerationª
OrderStatus
IN_BEARBEITUNG
ERFOLGREICH (AKTIVIERT)
ABGELEHNT
NICHT_IN_BEARBEITUNG
UniquesFact
+ Unique Clicks: int
+ Unique Users: int
+ Unique Views: int
AdCostFact
+ CPC: int
+ Kosten: float
Conv ersionFact
+ PC: int
+ PR: int
+ PV: int
+ Umsatz PC: float
+ Umsatz PR: float
+ Umsatz PV: float
AdVisibilityFact
+ Sichtbarkeitsdauer: float
Activ atedOrderFact
+ Orders: int
+ Umsatz: float
TrackingFact
+ Orders: int
+ Page Impressions: int
+ Umsatz: float
X = {7, 14, 28, 30}
§ Fault tolerant message handling
§ Event handling: Apply schema, time-partitioning, De-dup, sanity
checks, pre-aggregation, filtering, fraud detection
§ Tolerates delayed events
§ High throughput, moderate latency (~ 1min)