Marketing Analytics: tecniche e applicazioni pratiche con GA4 e Python

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Powered by Head of Analytics @ Nucleus https://www.linkedin.com/in/gianluca-campo/ https://www.giancampo.com/ Membro organizzatore di MeasureCamp Italy Chi sono https://italy.measurecamp.org/

Slide 3

Slide 3 text

Powered by Agenda 1. Cos’è la Marketing Analytics 2. Perché ne parliamo 3. Estrarre i dati da GA4 4. Applicazioni di Marketing Analytics a. Prevedere il futuro b. Rilevare anomalie c. Assegnare risultati d. Decidere un vincitore 5. Key takeaways Introduzione Premesse 1. Grazie Search Marketing Connect! 2. Ho strutturato la presentazione come l’avrei voluta io se fossi stato nell’audience 3. Vedremo concetti e possibili applicazioni per creare le proprie case histories 4. Molti termini sono tradotti dall’Inglese e potrebbero non essere allineati al gergo tecnico italiano Questo intervento è per chi: 1. pensa che la digital analytics non sia solo data collection 2. ha l’obiettivo di misurare le performance dei media e ottimizzarne gli investimenti 3. non ha paura di cimentarsi con un po’ di codice e statistica 4. anche se non sa usare Python, vuole apprendere i concetti che stanno dietro i modelli di marketing analytics

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Powered by Cos’è // Marketing Analytics AKA Marketing Science [...] marketing science is the analytic arm of marketing. Marketing science (interchangeable with marketing analytics) seeks to quantify causality. Marketing science is not an oxymoron (like military intelligence, happily married or jumbo shrimp) but is a necessary (although not sufﬁcient) part of marketing strategy [...] Mike Grigsby

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Powered by Cos’è // Quanti Analytics? data analytics web analytics web analytics + mktg + data analytics marketing analytics

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Powered by Perché // Tracciare non basta più 1. Normativa sulla privacy sempre più stringente 2. Deprecazione dei cookie di terza parte e limitazione dei cookie di prima parte 3. In generale, è sempre più importante per le aziende raggiungere uno stadio alto della data maturity Avremo dunque sempre meno dati e l’evoluzione della tecnologia - ad es. server-side tagging - non ci consentirà di recuperarli tutti.

Slide 11

Slide 11 text

Powered by Perché // Marketing Analytics FTW Pianiﬁcare 1. Forecasting 2. Anomaly Detection Misurare l’efﬁcacia dei canali 1. Attribuzione 2. MMM 3. Sperimentazione Segmentare 1. RFM Analysis 2. Customer Lifetime Value 3. Analisi delle Customer Survey 4. Market Basket Analysis Data Analytics for Marketing | Data | Print

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Powered by GA4 // Google APIs Explorer https://developers.google.com/analytics/devguides/reporting/data/v1/rest/v1beta/properties/runReport

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Powered by Forecasting // Metodi semplici (1) Metodo della media: la previsione corrisponde alla media della serie storica Metodo naive (o random walk): la previsione corrisponde all’ultimo valore registrato

Slide 21

Slide 21 text

Powered by Forecasting // Metodi semplici (2) Metodo naive stagionale: la previsione utilizza i dati storici corrispondenti ad es. allo stesso mese dell’anno precedente Metodo del drift: la previsione corrisponde alla proiezione della variazione media dei dati nel tempo (cd. drift o deriva)

Slide 22

Slide 22 text

Powered by Forecasting // Caratteristiche delle serie storiche Trend direzione generale - positiva o negativa - della serie storica Stagionalità pattern ricorrente legato da fattori stagionali come giorno della settimana o mese dell’anno Dati residuali cioè rumore della serie storica, in Inglese detto random, residual o error Cicli cioè pattern che si ripetono ma senza un periodo ﬁsso, in genere per fattori esterni, ad es. i cicli economici

Slide 23

Slide 23 text

Powered by Forecasting // Decomposizione delle serie storiche Esistono due approcci: 1. Decomposizione additiva: Serie storica = Trend + Stagionalità + Residuo 2. Decomposizione moltiplicativa: Serie storica = Trend * Stagionalità * Residuo Operazioni con la decomposizione additiva: ● Serie storica destagionalizzata = Serie storica - Stagionalità ● Serie storica senza trend = Serie storica - Trend La decomposizione è utile per studiare le serie storiche, ma ha anche risvolti pratici sul forecasting in sé

Slide 24

Slide 24 text

Powered by Forecasting // Metodi avanzati (1) Regressione con metodo OLS (Ordinary Least Squares): ● è la classica regressione lineare ● si può fare anche con Excel in modo molto semplice (vedi qui per dettagli) Modelli ETS (Error-Trend-Seasonality): ● usano una media ponderata delle precedenti osservazioni: più è vecchia l’osservazione, minore sarà il peso ad essa assegnato ● ad ogni lettera dell’acronimo corrisponde un valore che indica come decomporre la serie storica ● Excel mette a disposizione la versione AAA (errore Additivo, trend Additivo + stagionalità Additiva, vedi qui per dettagli) modello AAA modello AAM modello AMM modello AMA Google Colab: Marketing Analytics w/ Python - Time Series Forecasting.ipynb

Slide 25

Slide 25 text

Powered by Forecasting // Metodi avanzati (2) Modelli ARIMA (Auto Regressive Integrated Moving Average): ● sono detti modelli autoregressivi (AR) quelli in cui ○ la regressione viene calcolata tra la variabile da stimare (dipendente) e le osservazioni precedenti ○ a differenza della regressione lineare classica che è calcolata tra la variabile da stimare e le variabili indipendenti (fattori esterni) ● sono detti modelli con media mobile (MA, moving average) quelli in cui ○ la regressione viene calcolata tra la variabile dipendente e gli errori (rumore della serie storica) ● i modelli ARIMA sono un incrocio tra i due modelli appena visti ● i modelli ARIMA(p,d,q) si distinguono tra loro per valori diversi di: ○ p, speciﬁca dell’autoregressione ○ d, numero di differenziazioni ○ q, speciﬁca della media mobile Google Colab: Marketing Analytics w/ Python - Time Series Forecasting.ipynb

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Powered by Deﬁnizione: ● un’osservazione inattesa e che non ci si aspetta accada di nuovo ● può essere causata da ○ errori nei dati - ad es. tracking mancante ○ cambiamenti nella generazione dei dati - ad es. CTR in calo in SERP per modiﬁche alla pubblicazione di annunci Search Si possono distinguere due tipi di anomalie: 1. punti anomali singole osservazioni diverse rispetto al resto della serie storica (anomalia globale), o ai vicini (anomalia locale) 2. sequenze anomale sequenza di osservazioni diverse rispetto al resto della serie storica o alle sequenze vicine Anomaly detection // Cos’è un’anomalia?

Slide 28

Slide 28 text

Powered by Anomaly detection // Metodi (1) Google Colab: Marketing Analytics w/ Python - Anomaly Detection.ipynb Decomposizione STL (Seasonal-Trend con LOESS): ● è una tecnica di decomposizione additiva delle serie storiche ● si usa nell’anomaly detection perché le anomalie vengono incluse nella componente residuale ● una volta isolata la parte residuale si sfrutta la regola di Tukey per rilevare le anomalie, vd. rappresentazione graﬁca nel boxplot a destra

Slide 29

Slide 29 text

Powered by Anomaly detection // Metodi (2) Isolation forests: ● l’algoritmo delle “foreste di isolamento” si basa sul principio che le anomalie sono poche, ben distinte e dunque facili da isolare ● l’idea di base è deﬁnire per split successivi del dataset cosa è anomalo e cosa invece è un dato normale Google Colab: Marketing Analytics w/ Python - Anomaly Detection.ipynb

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Powered by Introduzione // Triangolazione nel Mktg Measurement A marzo di quest’anno, Google ha pubblicato il “Modern Measurement Playbook” (ne ho parlato al MeasureCamp Zurigo): ● nel playbook viene introdotto un framework per valutare l’efﬁcacia delle campagne di marketing: il cd. Media Effectiveness Measurement ● tra i concetti fondamentali, viene presentato quello della triangolazione cioè l’utilizzo contemporaneo di Attribuzione (MTA), Incrementalità e Mktg Mix Modeling (MMM) per accertare il valore delle campagne di marketing In questa presentazione, invece: 1. vediamo come calcolare MTA e MMM (prossimo capitolo) 2. non tratteremo invece gli esperimenti di incrementalità perché meriterebbero una sessione dedicata

Slide 32

Slide 32 text

Powered by Last touch: ● il credito viene tutto assegnato all’ultimo touchpoint ● favorisce i canali Bottom of the Funnel (BoFu), ad es. Paid Search First touch: ● credito al primo touchpoint ● favorisce i canali Top of the Funnel (ToFu), ad es. la Display Last non-direct: ● credito all’ultimo touchpoint escludendo il diretto ● simile al last touch MTA // Modelli euristici (1) Google Colab: Marketing Analytics w/ Python - Heuristic Attribution Models.ipynb

Slide 33

Slide 33 text

Powered by MTA // Modelli euristici (2) Linear: ● credito distribuito alla parti tra i vari touchpoint ● contro: potrebbe sottovalutare i touchpoint più importanti Time decay: ● credito crescenti agli ultimi touchpoint ● ipotizza un’importanza maggiore degli ultimi touchpoint Position-based: ● credito maggiore a primo e ultimo touchpoint, il resto ai touchpoint intermedi ● viene anche chiamato U-shaped Google Colab: Marketing Analytics w/ Python - Heuristic Attribution Models.ipynb

Slide 34

Slide 34 text

Powered by MTA // Fractribution La Fractribution: ● è un modello algoritmico creato da Google il cui nome deriva dall’unione dei termini “fractional” e “attribution” ● è un modello algoritmico, detto anche modello data-driven (DDA) Il valore di Shapley: ● è il concetto alla base della fractribution ● viene dalla teoria dei giochi e serve ad assegnare una ricompensa ai giocatori di una squadra, in base al contributo che apportano Tornando alla marketing attribution: ● una squadra corrisponde ad una serie di canali nel ﬂusso di un utente ● un giocatore corrisponde ad un canale di marketing Google Colab: Marketing Analytics w/ Python - Shapley Values and Fractribution .ipynb

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Powered by MMM // Confronto con MTA MMM è una tecnica di analisi statistica basata sulla regressione che invece: 1. considera sia campagne click-based che le view-based 2. può includere sia i canali di marketing online che offline 3. non è limitato dalla regolamentazione su privacy e cookie perché non richiede dati a livello di utenti Per questo e altri spunti raccomando di seguire la Attribution Masterclass di Barbara Galiza e Timo Dechau Svantaggi di MTA: 1. è un metodo click-based dunque a. campagne view-based - ad es. campagne video - non sono considerate b. campagne cross-device di utenti non loggati possono essere difficili da attribuire c. conversion journey lunghi, che vanno oltre le lookback windows, non possono essere attribuiti in modo corretto 2. non include canali di marketing offline, non digitali 3. i dati possono essere limitati dalla regolamentazione su privacy e cookie

Slide 37

Slide 37 text

Powered by MMM // Requisiti e aspetti critici Google Colab: Marketing Analytics w/ Python - MMM.ipynb Aspetti critici: 1. Effetto trascinamento (carryover), un annuncio in TV può richiedere diversi giorni prima di produrre effetti 2. Effetto decadimento (decay), le attività di marketing perdono risonanza nel tempo 3. Effetto saturazione, le attività di marketing raggiungono un punto in cui a maggiore spesa non corrisponde maggiore guadagno Metriche: 1. variabile dipendente, il KPI per cui vogliamo ottimizzare il budget può essere fatturato o qualunque altra metrica cruciale per il business 2. variabili indipendenti, cioè tutte le metriche che possono impattare i risultati: a. impressioni, click, spesa ADV b. in casi particolari anche dati macroeconomici come PIL, tasso di disoccupazione ecc Granularità dei dati: 1. >10-20 variabili indipendenti 2. >2 anni di dati settimanali oppure >4-5 anni di dati mensili 3. regola importante: se una variabile registra poche variazioni o registra bassi volumi, può essere rimossa

Slide 38

Slide 38 text

Powered by MMM // Il modello adstock Google Colab: Marketing Analytics w/ Python - MMM.ipynb Il modello adstock cerca di misurare l’effetto dell’ammontare (stock) di investimenti pubblicitari (ad) L’adstock geometrico - il più semplice dei modelli - si caratterizza per: ● Adstock corrente = Spesa ADV precedente * fattore di decadimento + Spesa ADV corrente ● Volume vendite corrente = Adstock corrente * fattore di efficacia + Vol. vendite senza adstock (baseline) ● Contributo di un canale = Adstock corrente del canale * fatt. efficacia / Totale Adstock corrente * fattore di efficacia totale Effetto decadimento e trascinamento sono incorporati in questo modello consentendone un superamento

Slide 39

Slide 39 text

Powered by MMM // Saturazione e rendimenti decrescenti Google Colab: Marketing Analytics w/ Python - MMM.ipynb La saturazione può essere rappresentata matematicamente come una funzione logistica. Rivediamo il modello adstock sulla base di questa nuova nozione: da Adstock corrente = Spesa ADV precedente * fattore di decadimento + Spesa ADV corrente a Adstock corrente = funz. logistica (Spesa ADV precedente * fattore di decadimento + Spesa ADV corrente)

Slide 40

Slide 40 text

Slide 41

Slide 41 text

Powered by Cosa ci portiamo a casa 1. La tecnologia non è sufﬁciente a sostenere l’evoluzione della normativa su privacy e cookie 2. Una delle possibili risposte a queste nuove sﬁde è un migliore uso dei dati che abbiamo a disposizione 3. La marketing analytics è la disciplina che può supportare le decisioni di marketing in questo quadro complesso