Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Marketing Analytics: tecniche e applicazioni pr...

Marketing Analytics: tecniche e applicazioni pratiche con GA4 e Python

Gianluca Campo

January 02, 2025
Tweet

More Decks by Gianluca Campo

Other Decks in Marketing & SEO

Transcript

  1. Powered by Agenda 1. Cos’è la Marketing Analytics 2. Perché

    ne parliamo 3. Estrarre i dati da GA4 4. Applicazioni di Marketing Analytics a. Prevedere il futuro b. Rilevare anomalie c. Assegnare risultati d. Decidere un vincitore 5. Key takeaways Introduzione Premesse 1. Grazie Search Marketing Connect! 2. Ho strutturato la presentazione come l’avrei voluta io se fossi stato nell’audience 3. Vedremo concetti e possibili applicazioni per creare le proprie case histories 4. Molti termini sono tradotti dall’Inglese e potrebbero non essere allineati al gergo tecnico italiano Questo intervento è per chi: 1. pensa che la digital analytics non sia solo data collection 2. ha l’obiettivo di misurare le performance dei media e ottimizzarne gli investimenti 3. non ha paura di cimentarsi con un po’ di codice e statistica 4. anche se non sa usare Python, vuole apprendere i concetti che stanno dietro i modelli di marketing analytics
  2. Powered by Cos’è // Marketing Analytics AKA Marketing Science [...]

    marketing science is the analytic arm of marketing. Marketing science (interchangeable with marketing analytics) seeks to quantify causality. Marketing science is not an oxymoron (like military intelligence, happily married or jumbo shrimp) but is a necessary (although not sufficient) part of marketing strategy [...] Mike Grigsby
  3. Powered by Cos’è // Quanti Analytics? data analytics web analytics

    web analytics + mktg + data analytics marketing analytics
  4. Powered by Perché // Tracciare non basta più 1. Normativa

    sulla privacy sempre più stringente 2. Deprecazione dei cookie di terza parte e limitazione dei cookie di prima parte 3. In generale, è sempre più importante per le aziende raggiungere uno stadio alto della data maturity Avremo dunque sempre meno dati e l’evoluzione della tecnologia - ad es. server-side tagging - non ci consentirà di recuperarli tutti.
  5. Powered by Perché // Marketing Analytics FTW Pianificare 1. Forecasting

    2. Anomaly Detection Misurare l’efficacia dei canali 1. Attribuzione 2. MMM 3. Sperimentazione Segmentare 1. RFM Analysis 2. Customer Lifetime Value 3. Analisi delle Customer Survey 4. Market Basket Analysis Data Analytics for Marketing | Data | Print
  6. Powered by Forecasting // Metodi semplici (1) Metodo della media:

    la previsione corrisponde alla media della serie storica Metodo naive (o random walk): la previsione corrisponde all’ultimo valore registrato
  7. Powered by Forecasting // Metodi semplici (2) Metodo naive stagionale:

    la previsione utilizza i dati storici corrispondenti ad es. allo stesso mese dell’anno precedente Metodo del drift: la previsione corrisponde alla proiezione della variazione media dei dati nel tempo (cd. drift o deriva)
  8. Powered by Forecasting // Caratteristiche delle serie storiche Trend direzione

    generale - positiva o negativa - della serie storica Stagionalità pattern ricorrente legato da fattori stagionali come giorno della settimana o mese dell’anno Dati residuali cioè rumore della serie storica, in Inglese detto random, residual o error Cicli cioè pattern che si ripetono ma senza un periodo fisso, in genere per fattori esterni, ad es. i cicli economici
  9. Powered by Forecasting // Decomposizione delle serie storiche Esistono due

    approcci: 1. Decomposizione additiva: Serie storica = Trend + Stagionalità + Residuo 2. Decomposizione moltiplicativa: Serie storica = Trend * Stagionalità * Residuo Operazioni con la decomposizione additiva: • Serie storica destagionalizzata = Serie storica - Stagionalità • Serie storica senza trend = Serie storica - Trend La decomposizione è utile per studiare le serie storiche, ma ha anche risvolti pratici sul forecasting in sé
  10. Powered by Forecasting // Metodi avanzati (1) Regressione con metodo

    OLS (Ordinary Least Squares): • è la classica regressione lineare • si può fare anche con Excel in modo molto semplice (vedi qui per dettagli) Modelli ETS (Error-Trend-Seasonality): • usano una media ponderata delle precedenti osservazioni: più è vecchia l’osservazione, minore sarà il peso ad essa assegnato • ad ogni lettera dell’acronimo corrisponde un valore che indica come decomporre la serie storica • Excel mette a disposizione la versione AAA (errore Additivo, trend Additivo + stagionalità Additiva, vedi qui per dettagli) modello AAA modello AAM modello AMM modello AMA Google Colab: Marketing Analytics w/ Python - Time Series Forecasting.ipynb
  11. Powered by Forecasting // Metodi avanzati (2) Modelli ARIMA (Auto

    Regressive Integrated Moving Average): • sono detti modelli autoregressivi (AR) quelli in cui ◦ la regressione viene calcolata tra la variabile da stimare (dipendente) e le osservazioni precedenti ◦ a differenza della regressione lineare classica che è calcolata tra la variabile da stimare e le variabili indipendenti (fattori esterni) • sono detti modelli con media mobile (MA, moving average) quelli in cui ◦ la regressione viene calcolata tra la variabile dipendente e gli errori (rumore della serie storica) • i modelli ARIMA sono un incrocio tra i due modelli appena visti • i modelli ARIMA(p,d,q) si distinguono tra loro per valori diversi di: ◦ p, specifica dell’autoregressione ◦ d, numero di differenziazioni ◦ q, specifica della media mobile Google Colab: Marketing Analytics w/ Python - Time Series Forecasting.ipynb
  12. Powered by Definizione: • un’osservazione inattesa e che non ci

    si aspetta accada di nuovo • può essere causata da ◦ errori nei dati - ad es. tracking mancante ◦ cambiamenti nella generazione dei dati - ad es. CTR in calo in SERP per modifiche alla pubblicazione di annunci Search Si possono distinguere due tipi di anomalie: 1. punti anomali singole osservazioni diverse rispetto al resto della serie storica (anomalia globale), o ai vicini (anomalia locale) 2. sequenze anomale sequenza di osservazioni diverse rispetto al resto della serie storica o alle sequenze vicine Anomaly detection // Cos’è un’anomalia?
  13. Powered by Anomaly detection // Metodi (1) Google Colab: Marketing

    Analytics w/ Python - Anomaly Detection.ipynb Decomposizione STL (Seasonal-Trend con LOESS): • è una tecnica di decomposizione additiva delle serie storiche • si usa nell’anomaly detection perché le anomalie vengono incluse nella componente residuale • una volta isolata la parte residuale si sfrutta la regola di Tukey per rilevare le anomalie, vd. rappresentazione grafica nel boxplot a destra
  14. Powered by Anomaly detection // Metodi (2) Isolation forests: •

    l’algoritmo delle “foreste di isolamento” si basa sul principio che le anomalie sono poche, ben distinte e dunque facili da isolare • l’idea di base è definire per split successivi del dataset cosa è anomalo e cosa invece è un dato normale Google Colab: Marketing Analytics w/ Python - Anomaly Detection.ipynb
  15. Powered by Introduzione // Triangolazione nel Mktg Measurement A marzo

    di quest’anno, Google ha pubblicato il “Modern Measurement Playbook” (ne ho parlato al MeasureCamp Zurigo): • nel playbook viene introdotto un framework per valutare l’efficacia delle campagne di marketing: il cd. Media Effectiveness Measurement • tra i concetti fondamentali, viene presentato quello della triangolazione cioè l’utilizzo contemporaneo di Attribuzione (MTA), Incrementalità e Mktg Mix Modeling (MMM) per accertare il valore delle campagne di marketing In questa presentazione, invece: 1. vediamo come calcolare MTA e MMM (prossimo capitolo) 2. non tratteremo invece gli esperimenti di incrementalità perché meriterebbero una sessione dedicata
  16. Powered by Last touch: • il credito viene tutto assegnato

    all’ultimo touchpoint • favorisce i canali Bottom of the Funnel (BoFu), ad es. Paid Search First touch: • credito al primo touchpoint • favorisce i canali Top of the Funnel (ToFu), ad es. la Display Last non-direct: • credito all’ultimo touchpoint escludendo il diretto • simile al last touch MTA // Modelli euristici (1) Google Colab: Marketing Analytics w/ Python - Heuristic Attribution Models.ipynb
  17. Powered by MTA // Modelli euristici (2) Linear: • credito

    distribuito alla parti tra i vari touchpoint • contro: potrebbe sottovalutare i touchpoint più importanti Time decay: • credito crescenti agli ultimi touchpoint • ipotizza un’importanza maggiore degli ultimi touchpoint Position-based: • credito maggiore a primo e ultimo touchpoint, il resto ai touchpoint intermedi • viene anche chiamato U-shaped Google Colab: Marketing Analytics w/ Python - Heuristic Attribution Models.ipynb
  18. Powered by MTA // Fractribution La Fractribution: • è un

    modello algoritmico creato da Google il cui nome deriva dall’unione dei termini “fractional” e “attribution” • è un modello algoritmico, detto anche modello data-driven (DDA) Il valore di Shapley: • è il concetto alla base della fractribution • viene dalla teoria dei giochi e serve ad assegnare una ricompensa ai giocatori di una squadra, in base al contributo che apportano Tornando alla marketing attribution: • una squadra corrisponde ad una serie di canali nel flusso di un utente • un giocatore corrisponde ad un canale di marketing Google Colab: Marketing Analytics w/ Python - Shapley Values and Fractribution .ipynb
  19. Powered by MMM // Confronto con MTA MMM è una

    tecnica di analisi statistica basata sulla regressione che invece: 1. considera sia campagne click-based che le view-based 2. può includere sia i canali di marketing online che offline 3. non è limitato dalla regolamentazione su privacy e cookie perché non richiede dati a livello di utenti Per questo e altri spunti raccomando di seguire la Attribution Masterclass di Barbara Galiza e Timo Dechau Svantaggi di MTA: 1. è un metodo click-based dunque a. campagne view-based - ad es. campagne video - non sono considerate b. campagne cross-device di utenti non loggati possono essere difficili da attribuire c. conversion journey lunghi, che vanno oltre le lookback windows, non possono essere attribuiti in modo corretto 2. non include canali di marketing offline, non digitali 3. i dati possono essere limitati dalla regolamentazione su privacy e cookie
  20. Powered by MMM // Requisiti e aspetti critici Google Colab:

    Marketing Analytics w/ Python - MMM.ipynb Aspetti critici: 1. Effetto trascinamento (carryover), un annuncio in TV può richiedere diversi giorni prima di produrre effetti 2. Effetto decadimento (decay), le attività di marketing perdono risonanza nel tempo 3. Effetto saturazione, le attività di marketing raggiungono un punto in cui a maggiore spesa non corrisponde maggiore guadagno Metriche: 1. variabile dipendente, il KPI per cui vogliamo ottimizzare il budget può essere fatturato o qualunque altra metrica cruciale per il business 2. variabili indipendenti, cioè tutte le metriche che possono impattare i risultati: a. impressioni, click, spesa ADV b. in casi particolari anche dati macroeconomici come PIL, tasso di disoccupazione ecc Granularità dei dati: 1. >10-20 variabili indipendenti 2. >2 anni di dati settimanali oppure >4-5 anni di dati mensili 3. regola importante: se una variabile registra poche variazioni o registra bassi volumi, può essere rimossa
  21. Powered by MMM // Il modello adstock Google Colab: Marketing

    Analytics w/ Python - MMM.ipynb Il modello adstock cerca di misurare l’effetto dell’ammontare (stock) di investimenti pubblicitari (ad) L’adstock geometrico - il più semplice dei modelli - si caratterizza per: • Adstock corrente = Spesa ADV precedente * fattore di decadimento + Spesa ADV corrente • Volume vendite corrente = Adstock corrente * fattore di efficacia + Vol. vendite senza adstock (baseline) • Contributo di un canale = Adstock corrente del canale * fatt. efficacia / Totale Adstock corrente * fattore di efficacia totale Effetto decadimento e trascinamento sono incorporati in questo modello consentendone un superamento
  22. Powered by MMM // Saturazione e rendimenti decrescenti Google Colab:

    Marketing Analytics w/ Python - MMM.ipynb La saturazione può essere rappresentata matematicamente come una funzione logistica. Rivediamo il modello adstock sulla base di questa nuova nozione: da Adstock corrente = Spesa ADV precedente * fattore di decadimento + Spesa ADV corrente a Adstock corrente = funz. logistica (Spesa ADV precedente * fattore di decadimento + Spesa ADV corrente)
  23. Powered by Cosa ci portiamo a casa 1. La tecnologia

    non è sufficiente a sostenere l’evoluzione della normativa su privacy e cookie 2. Una delle possibili risposte a queste nuove sfide è un migliore uso dei dati che abbiamo a disposizione 3. La marketing analytics è la disciplina che può supportare le decisioni di marketing in questo quadro complesso