Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Tecniche di Machine Learning e di Analisi Dati ...

Tecniche di Machine Learning e di Analisi Dati a supporto covid19

Tecniche di machine learning e di analisi dati dell’emergenza covid19

Francesco Marchitelli

April 30, 2020
Tweet

More Decks by Francesco Marchitelli

Other Decks in Technology

Transcript

  1. Tecniche di Machine Learning e di Analisi Dati a supporto

    covid19 Open Puglia Zoom Aperitivo #2 30 Aprile 2020 Francesco Marchitelli
  2. Machine Learning Il Machine Learning è un metodo di analisi

    dati che automatizza la costruzione di modelli analitici. È una branca dell'Intelligenza Artificiale e si basa sull'idea che i sistemi possano imparare dai dati, identificare modelli autonomamente e prendere decisioni con un intervento umano ridotto al minimo.
  3. Tipologie di problemi • Classificazione: quando è necessario decidere a

    quale categoria appartiene un determinato dato. • Raggruppamento (clustering): quando si vuole raggruppare i dati che presentano caratteristiche simili. • Regressione: prevedere il valore futuro di un dato avendo noto il suo valore attuale.
  4. Supervised Learning In questa categoria di Machine Learning al computer

    vengono “dati in pasto” sia dei set di dati come input sia le informazioni relative ai risultati desiderati, con l’obiettivo che il sistema identifichi una regola generale che colleghi i dati in ingresso con quelli in uscita, in modo da poter poi riutilizzare tale regola per altri compiti simili.
  5. Unsupervised Learning In questa seconda categoria al sistema vengono forniti

    solo set di dati senza alcuna indicazione del risultato desiderato. Lo scopo è “risalire” a schemi e modelli nascosti, ossia identificare negli input una struttura logica senza che questi siano preventivamente etichettati.
  6. Reinforcement Learning In questo caso, il sistema deve interagire con

    un ambiente dinamico, che gli consente di avere i dati di input, e raggiungere un obiettivo al raggiungimento del quale riceve una ricompensa, imparando anche dagli errori, identificati medianti “punizioni”. Il comportamento e le prestazioni del sistema sono determinate da una routine di apprendimento basata su ricompensa e punizione.
  7. Semi-Supervised Learning In questo caso si tratta di un modello

    “ibrido” dove al computer viene fornito un set di dati incompleti per l’allenamento/apprendimento; alcuni di questi input sono “dotati” dei rispettivi esempi di output, altri invece ne sono privi.
  8. Principali Tecniche • Regressione Lineare Permette di stimare il valore

    di una variabile dipendente da tante altre. • Anomaly Detection Utilizzato per identificare valori anomali o casi insoliti nei dati. I modelli di rilevamento delle anomalie memorizzano le informazioni sul comportamento normale. Ciò consente di identificare i valori anomali anche se non sono conformi a uno schema noto. • Apriori Machine Learning Algorithm Genera delle regole di associazione a partire da un insieme di dati. Queste regole sono nella forma «if… then».
  9. Principali Tecniche • Support Vector Machine (SVM) Algoritmo di apprendimento

    supervisionato utilizzato sia per problemi di classificazione che di regressione. • Naïve Bayes Classifier Algorithm Algoritmo di classificazione di contenuti testuali. • K- Means Clustering Algorithm Algoritmo iterativo che si occupa di suddividere una popolazione in k gruppi determinati a priori. In questo caso, quindi, è necessario suddividere i risultati in k gruppi diversi, in modo che tutti quelli che appartengono ad un gruppo siano correlati.