Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Automazione per la SEO con KNIME

Automazione per la SEO con KNIME

Gianluca Campo

September 26, 2022
Tweet

More Decks by Gianluca Campo

Other Decks in Marketing & SEO

Transcript

  1. Agenda 1. Fondamenti della SEO • Cos’è la Search Engine

    Optimization • Funzionamento dei motori di ricerca • Attività e strumenti della SEO 2. Esempi di automazione per la SEO • Analisi dei file di log in ottica SEO • Automazione di Google Search Console • Raggruppamento semiautomatico di ricerche organiche
  2. La SEO aumenta il traffico ad un sito sfruttando i

    risultati organici SEO, Search Engine Optimization significa ottimizzazione per i motori di ricerca. Fare SEO significa utilizzare tutte le tecniche e le strategie possibili per spingere verso l'alto i risultati di un sito nelle pagine dei motori di ricerca, facendo guadagnare visite di qualità e opportunità di business. Le visite acquisite grazie alla SEO sono di qualità perché rispondono direttamente ad un'esigenza espressa dall'utente. Risultati organici: su questi lavora la SEO SEO Risultati a pagamento Google Ads
  3. Come funziona un motore di ricerca Internet Crawler Scheduler Parser

    Indexing Index URLs Search Fonte: https://searchengineland.com/how-search-engines-work-really-171556
  4. • Cos’è un web crawler • Funzionalità del parser •

    Cosa fa lo scheduler Scansione Internet Crawler Scheduler Parser Indexing Index URLs Search
  5. • Posizionamento • Algoritmi di ranking • Machine learning Ranking

    Internet Crawler Scheduler Parser Indexing Index URLs Search
  6. Come si ottengono ranking migliori? • Ottimizzazione tecnica: rappresenta la

    base di un buon progetto, perché un piccolo errore in questa parte riduce l'efficacia di tutto il resto. • Ottimizzazione (ed eventuale espansione) dei contenuti: è la parte in cui è più facile crescere, in quanto la produzione di contenuti è poco onerosa ed aumenta linearmente il numero di keyword per cui il sito si può posizionare. • Ottimizzazione dell'autorevolezza: si tratta della variabile più difficile da far aumentare, ma anche quella che determina un vantaggio competitivo di lungo periodo. Ottimizzazione tecnica Contenuti Autorevolezza Traffico organico
  7. Alcune attività e strumenti per la SEO Ottimizzazione tecnica •

    Analisi sulla scansione • Analisi sull'indicizzazione • Indicazioni per il ranking • Migrazione di URL e piani di redirect • … Contenuti • Analisi delle ricerche degli utenti • Progettazione dell'architettura informativa • Espansione dei contenuti testuali e multimediali • … Trust building • Analisi qualitativa e quantitativa dei backlink in ingresso • Digital PR e outreach • …
  8. Cos’è un file di log? 1. Un client richiede una

    risorsa HTTP 2. Il server restituisce la risorsa richiesta, se possibile 3. Il server registra questa informazione in un ‘’diario’’ Questo diario è chiamato comunemente file di log (logfile): anche i crawler di Google sono tracciati in questo file.
  9. Esempio di record dai log invalid_host.log.2020052023:www.dominio.it [21/May/2020:01:49:16 +0200] [21/May/2020:01:49:16 +0200]

    XXXX GET /wp-content/uploads/2019/12/01.jpg HTTP/2.0 200 | 253827 https://www.google.it/ Mozilla/5.0 (Linux; Android 8.1.0; SAMSUNG SM-J730F Build/M1AJQ) AppleWebKit/537.36 (KHTML, like Gecko) SamsungBrowser/8.2 Chrome/63.0.3239.111 Mobile Safari/537.36 8179 miss - Mobile - true 217.196.141.207 217.196.141.207 245 254045 0 0 Metodo HTTP e risorsa richiesta Protocollo HTTP Codice di stato HTTP Referrer HTTP (da dove arriva la visita) User agent
  10. Scarichiamo i file di log e li salviamo in una

    cartella sul desktop Spesso i file di log sono compressi
  11. Infine, esportiamo tutti i dati in un file Excel Nota:

    sono state aggiunte ulteriori porte di input cliccando i tre puntini
  12. Capire il request body di Google Search Console (Search Analytics)

    - #1 https://developers.google.com/webmaster-tools/v1/searchanalytics/query
  13. Capire il request body di Google Search Console (Search Analytics)

    - #2 https://developers.google.com/webmaster-tools/v1/searchanalytics/query
  14. Esempio di regola utilizzata $Query più frequenti$ MATCHES "(.*10 buoni

    propositi.*)|(.*24bottles.*)|(.*2jewels.*)|(.*4us cesare paciotti.*)|(.*ab aeterno.*)|(.*adidas.*)|(.*alv alviero martini.*)|(.*alviero martini prima classe.*)|(.*ambrosia.*)|(.*amen.*)|(.*ania haie.*)|(.*argenesi.*)|(.*armani exchange.*)|(.*arti & mestieri.*)|(.*a.s. roma.*)|(.*atalanta.*)|(.*avion.*)|(.*bagutta.*)|(.*barbieri.*)|(.*barbosa.*)|(.*beloved.*)|(.*bering.*)|(.*b&g.*)|(.*bliss.*)|(.*bmw.*)|(.*boccadamo.*)| (.*bologna f.c..*)|(.*bottega boccadamo.*)|(.*brand.*)|(.*breil.*)|(.*brosway.*)|(.*bulova.*)|(.*calvin klein.*)|(.*calypso.*)|(.*candlehand.*)|(.*capital.*)|(.*casio.*)|(.*cesare paciotti.*)|(.*chronostar.*)|(.*ciclòn.*)|(.*citizen.*)|(.*cluse.*)|(.*comete.*)|(.*connoisseurs.*)|(.*daniel wellington.*)|(.*david lian.*)|(.*designworks ink.*)|(.*diamonfire.*)|(.*diesel.*)|(.*disney.*)|(.*doodle.*)|(.*dvccio.*)|(.*egan.*)|(.*eleonora giordani.*)|(.*emporio armani.*)|(.*emporio armani swiss.*)|(.*engelsrufer.*)|(.*enrico coveri.*)|(.*erbolinea.*)|(.*esteban.*)|(.*even code.*)|(.*festina.*)|(.*fiorentina.*)|(.*fitbit.*)|(.*flik flak.*)|(.*for you jewels.*)|(.*fossil.*)|(.*furla.*)|(.*garmin.*)|(.*gc.*)|(.*gerba.*)|(.*giannotti.*)|(.*g-shock.*)|(.*guess.*)|(.*hamilton.*)|(.*harry potter.*)|(.*hip hop.*)|(.*hoops.*)|(.*hugo boss.*)|(.*inter.*)|(.*jack&co.*)|(.*jewelcandle.*)|(.*julie julsen.*)|(.*juventus.*)|(.*kamawatch.*)|(.*karlsson.*)|(.*kate spade new york.*)|(.*kidult.*)|(.*kikou.*)|(.*kulto.*)|(.*kulto925.*)|(.*l'angolo delle idee.*)|(.*le carose.*)|(.*leonardo argenti.*)|(.*liujo.*)|(.*locman.*)|(.*lorenz.*)|(.*lorus.*)|(.*lotus.*)|(.*lotus style.*)|(.*luca barra.*)|(.*lucien rochat.*)|(.*mabina gioielli.*)|(.*marc jacobs.*)|(.*maserati.*)|(.*melitea.*)|(.*michael kors.*)|(.*milan.*)|(.*millefiori milano.*)|(.*misfit.*)|(.*morellato.*)|(.*muhà.*)|(.*mvmt.*)|(.*namuri.*)|(.*nanan.*)|(.*nautica.*)|(.*nom.composable.*)|(.*nomination.*)|(.*olivia burton london.*)|(.*ops objects.*)|(.*ottaviani.*)|(.*oui&me.*)|(.*paddywax.*)|(.*pdpaola.*)|(.*pepe jeans.*)|(.*philipp plein.*)|(.*philip watch.*)|(.*pierre cardin.*)|(.*pierre lannier.*)|(.*pietro ferrante.*)|(.*pineider.*)|(.*pininfarina.*)|(.*pinko.*)|(.*polar.*)|(.*police.*)|(.*pomme pidou.*)|(.*present time.*)|(.*rebecca.*)|(.*rosato.*)|(.*rosenthal.*)|(.*sagapò.*)|(.*scuderia ferrari.*)|(.*sector.*)| (.*skagen.*)|(.*smarty.*)|(.*smile solar.*)|(.*sovrani.*)|(.*spark.*)|(.*s.s. lazio.*)|(.*s.t. dupont.*)|(.*stilarte.*)|(.*sting.*)|(.*superdry.*)|(.*superga.*)|(.*superstuff.*)|(.*swarovski.*)|(.*swatch.*)|(.*tamashii.*)|(.*techmade.*)|(.*tecnochic. *)|(.*timberland.*)|(.*timex.*)|(.*ti sento milano.*)|(.*tissot.*)|(.*tommy hilfiger.*)|(.*too late.*)|(.*torino f.c..*)|(.*trussardi.*)|(.*unoaerre.*)|(.*unoaerre fashion jewellery.*)|(.*unode50.*)|(.*vagary by citizen.*)|(.*valenti argenti.*)|(.*venini.*)|(.*versace.*)|(.*versus.*)|(.*woodwick.*)|(.*xiaomi.*)|(.*yankee candle.*)|(.*you bottles.*)|(.*zancan.*)|(.*zitto.*)" => "marchi venduti"
  15. Eseguiamo la scrittura su altro file di Google Sheets La

    porta di colore verde serve a collegare il nodo alla connessione già aperta con GSheets
  16. Key takeaways 1. Alcuni semplici passaggi consentono di automatizzare processi

    anche molto dispendiosi 2. Sfruttando le API e KNIME possiamo bypassare i limiti imposti dalle UI degli strumenti che utilizziamo 3. La piattaforma ha vaste potenzialità: un coltellino svizzero dell’automazione che consente attività dall’analisi dei log al web scraping
  17. Altre attività SEO che possiamo fare con KNIME… String matching

    per piani di redirect automatici Categorizzazione di keyword per revisione architettura informativa Clustering di schede prodotto per creazione categorie ecommerce Applicazioni di text mining e applicazione di TF-IDF, LDA Text generation per meta tag, anche con GPT-3