Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Tecniche di Machine Learning e di Analisi Dati a supporto covid19

Tecniche di Machine Learning e di Analisi Dati a supporto covid19

Tecniche di machine learning e di analisi dati dell’emergenza covid19

Francesco Marchitelli

April 30, 2020
Tweet

More Decks by Francesco Marchitelli

Other Decks in Technology

Transcript

  1. Tecniche di Machine Learning e
    di Analisi Dati a supporto
    covid19
    Open Puglia Zoom Aperitivo #2
    30 Aprile 2020
    Francesco Marchitelli

    View Slide

  2. Andamento di un’epidemia

    View Slide

  3. Funzione esponenziale

    View Slide

  4. Funzione logistica

    View Slide

  5. Modello SIR

    View Slide

  6. Modello SEIR

    View Slide

  7. Dashboard API Open Puglia
    https://www.francescomarchitelli.com/covid19

    View Slide

  8. Machine Learning
    Il Machine Learning è un metodo di analisi dati che automatizza
    la costruzione di modelli analitici.
    È una branca dell'Intelligenza Artificiale e si basa sull'idea che i
    sistemi possano imparare dai dati, identificare modelli
    autonomamente e prendere decisioni con un intervento
    umano ridotto al minimo.

    View Slide

  9. Come funziona il Machine Learning

    View Slide

  10. Tipologie di problemi
    • Classificazione: quando è necessario decidere a
    quale categoria appartiene un determinato dato.
    • Raggruppamento (clustering): quando si vuole
    raggruppare i dati che presentano caratteristiche
    simili.
    • Regressione: prevedere il valore futuro di un dato
    avendo noto il suo valore attuale.

    View Slide

  11. Supervised Learning
    In questa categoria di Machine Learning al computer vengono “dati in pasto”
    sia dei set di dati come input sia le informazioni relative ai risultati desiderati,
    con l’obiettivo che il sistema identifichi una regola generale che colleghi
    i dati in ingresso con quelli in uscita, in modo da poter poi riutilizzare tale
    regola per altri compiti simili.

    View Slide

  12. Unsupervised Learning
    In questa seconda categoria al sistema vengono forniti solo set di dati senza
    alcuna indicazione del risultato desiderato.
    Lo scopo è “risalire” a schemi e modelli nascosti, ossia identificare negli
    input una struttura logica senza che questi siano preventivamente
    etichettati.

    View Slide

  13. Reinforcement Learning
    In questo caso, il sistema deve interagire con un ambiente dinamico, che gli
    consente di avere i dati di input, e raggiungere un obiettivo al
    raggiungimento del quale riceve una ricompensa, imparando anche dagli
    errori, identificati medianti “punizioni”.
    Il comportamento e le prestazioni del sistema sono determinate da una
    routine di apprendimento basata su ricompensa e punizione.

    View Slide

  14. Semi-Supervised Learning
    In questo caso si tratta di un modello “ibrido” dove al computer viene
    fornito un set di dati incompleti per l’allenamento/apprendimento; alcuni di
    questi input sono “dotati” dei rispettivi esempi di output, altri invece
    ne sono privi.

    View Slide

  15. Principali Tecniche
    • Regressione Lineare
    Permette di stimare il valore di una variabile dipendente da tante altre.
    • Anomaly Detection
    Utilizzato per identificare valori anomali o casi insoliti nei dati. I modelli di
    rilevamento delle anomalie memorizzano le informazioni sul
    comportamento normale. Ciò consente di identificare i valori anomali
    anche se non sono conformi a uno schema noto.
    • Apriori Machine Learning Algorithm
    Genera delle regole di associazione a partire da un insieme di dati.
    Queste regole sono nella forma «if… then».

    View Slide

  16. Principali Tecniche
    • Support Vector Machine (SVM)
    Algoritmo di apprendimento supervisionato utilizzato sia per problemi di
    classificazione che di regressione.
    • Naïve Bayes Classifier Algorithm
    Algoritmo di classificazione di contenuti testuali.
    • K- Means Clustering Algorithm
    Algoritmo iterativo che si occupa di suddividere una popolazione in k
    gruppi determinati a priori. In questo caso, quindi, è necessario
    suddividere i risultati in k gruppi diversi, in modo che tutti quelli che
    appartengono ad un gruppo siano correlati.

    View Slide

  17. https://francescomarchitelli.com
    [email protected]

    View Slide