Upgrade to Pro — share decks privately, control downloads, hide ads and more …

TSFR Edition #14 - Analyse de séries temporelles multivariées dans le cadre d’évènements récurrents de satellites

D0a6969000c3715087b3a00abd646d20?s=47 TimeSeriesFr
February 02, 2022

TSFR Edition #14 - Analyse de séries temporelles multivariées dans le cadre d’évènements récurrents de satellites

Support de la présentation de Bruno Pinos de Kratos Solutions sur l'analyse des séries temporelles multivariées dans le cadre des manoeuvres de satellites.

D0a6969000c3715087b3a00abd646d20?s=128

TimeSeriesFr

February 02, 2022
Tweet

More Decks by TimeSeriesFr

Other Decks in Technology

Transcript

  1. Analyse de séries temporelles multivariées dans le cadre d’évènements récurrents

    Auteur : Pinos Bruno Date : 3 Février, 2022
  2. Introduction I. Introduction II. Extraction et mise en forme III.

    Distances IV.Clustering V. Conclusion 2
  3. I. Introduction 3

  4. Contexte Création d’un outil rapide, simple d’utilisation, compréhensible et flexible

    pour pouvoir permettre à nos utilisateurs non Data Scientist de réaliser des analyses poussées sur des événements récurrents comme les manœuvres de satellite. L’objectif principal de cet outil est la détection et la compréhension d’événements anormaux. 4
  5. Série temporelle 5 Une série temporelle, ou série chronologique, est

    une suite de valeurs numériques représentant l'évolution d'une quantité spécifique au cours du temps.
  6. Série temporelle 6 Temps en seconde Valeur Valeur 1s 1s

    1s 24s 11s 4s Également espacée Inégalement espacée
  7. Série temporelle multivariée 7 Une série temporelle multivariée est une

    série temporelle avec plusieurs variables dépendantes du temps.
  8. Evénements récurrents 8 Un événement récurrent dans une série temporelle

    est un ensemble de périodes définies où il se passe quelque chose de précis. Ces périodes ne reviennent pas forcément de manière saisonnière et ne sont pas forcément de même durée. Les manœuvres de satellite sont un exemple d’événements récurrents. Evénements récurrents
  9. La méthode utilisée Extraction et mise en forme des événements

    Calcul des distances entre les événements Regroupement des événements proches et analyse des événements isolés 9
  10. II. Extraction et mise en forme 10

  11. Extraction 11 Evénements récurrents Evénements récurrents après extraction

  12. Mise en forme 12 Evénements récurrents après extraction et mise

    en forme (rééchantillonnage et interpolation) - Pas de valeurs manquantes - Également espacées Evénements récurrents après extraction
  13. II. Distances 13

  14. 14 Par exemple p𝒐𝒖𝒓 𝑨 𝟏, 𝟏 𝒆𝒕 𝑩 𝟔,

    𝟒 : Distance euclidienne dans le plan 6 − 1 2 + 4 − 1 2 = 25 + 9 = 34 ≈ 5.83
  15. 15 Par exemple p𝒐𝒖𝒓 𝑨 𝟏, 𝟏, 𝟏, 𝟏 𝒆𝒕

    𝑩 𝟔, 𝟒, 𝟎, 𝟎 : Distance euclidienne en n dimension 𝑑 𝑎, 𝑏 = 6 − 1 2 + 4 − 1 2 + 1 − 0 2 + 1 − 0 2 = 25 + 9 + 1 + 1 = 36 = 6 Soit deux points de ℝn, A(x1 , x2 , …,xn ) et B(y1 , y2 , …,yn ):
  16. Distance euclidienne entre deux séries temporelles 16

  17. 17 Valeur Valeur Valeur Temps Les limites de la distance

    euclidienne TS1 TS2 TS3
  18. Les limites de la distance euclidienne 18 0 0 4

    4 4 4 4 4 4 4 0 0 0 TS1 TS2 𝑑 𝑇𝑆1, 𝑇𝑆2 = 4² + 4² + 4² + 4² + 4² + 4² + 4² + 4² ≈ 11.31
  19. 19 Les limites de la distance euclidienne TS1 TS3 𝑑

    𝑇𝑆1, 𝑇𝑆3 = 4² + 4² + 4² + 4² = 8 0 0 4 0 4 0 4 0 4 0 0 0 0 𝑑 𝑇𝑆1, 𝑇𝑆3 > 𝑑(𝑇𝑆1, 𝑇𝑆2)
  20. Dynamic time warping 20 - Règle le problème des décalages

    temporelles - Permet de prendre en compte la dilatation temporelle - Permet de comparer des séries temporelles de différentes longueurs Valeur Temps
  21. 21 Dynamic time warping Matrice de coût

  22. Exemple Dynamic time warping 22 t0 t1 t2 t3 TS1

    1 5 4 2 TS2 1 2 4 1 Soit TS1 et TS2 deux série temporelles:
  23. Exemple Dynamic time warping 23 0 1 0 3

  24. Exemple Dynamic time warping 24 𝐷𝑇𝑊𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒 (𝑇𝑆1, 𝑇𝑆2) = 0

    + 1 + 1 + 0 + 1 = 3 TS2 TS1
  25. Exemple Dynamic time warping 25 0 1 1 0 1

    𝐷𝑇𝑊𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒 (𝑇𝑆1, 𝑇𝑆2) = 0 + 1 + 1 + 0 + 1 = 3 TS1 TS2
  26. Contrainte 26 Valeur Temps

  27. Sakoe-Chiba band 27 Matrice de coût

  28. Sakoe-Chiba band 28

  29. DTW multivariée 29 LA DTW peut être utilisé pour calculer

    des distances entre des séries temporelles multivariées pour cela il suffit de compléter la matrice de coût en utilisant la distance euclidienne entre des points de dimension n, n étant le nombre de paramètres.
  30. Matrice de distance 30 Une matrice de distance est une

    matrice carrée ( tableau à deux dimensions) contenant les distances , prises par paires, entre les éléments d'un ensemble. 16 72 47
  31. La forme ou la valeur ? 31

  32. Z-normalisation 32 TS2 TS1 TS3 TS2 TS1 TS3

  33. IV. Clustering 33

  34. Définition Le partitionnement de données (ou clustering en anglais) est

    une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes. 34
  35. Choix de la méthode • K-MEANS - Méthode la plus

    utilisée en data science - Très efficace sur les séries temporelles (k-means dba) - Pas efficace pour la détection d’ouliers • DBSCAN - Méthode très utilisée pour la recherche d’outliers - S’adapte facilement aux séries temporelles grâce aux matrices de distance - Très sensible aux paramètres • Classification ascendante hiérarchique (CAH) - L’une des premières méthode et l’une des plus efficace - Grande explicabilité (Dendrogramme) - S’adapte facilement aux séries temporelles grâce aux matrices de distance 35
  36. Classification ascendante hiérarchique (CAH) 36 τ1 = 1.13 τ0 =

    0.19 τ2 = 4.58 Seuil Dendrogramme
  37. Exemple dendrogramme 37

  38. Exemple dendrogramme 38

  39. Exemple dendrogramme 39

  40. Mesure de dissimilarité inter-classe 40

  41. Exemple dendrogramme 41

  42. Exemple dendrogramme 42

  43. Exemple dendrogramme 43

  44. Exemple dendrogramme 44

  45. Exemple dendrogramme 45

  46. Exemple dendrogramme 46

  47. Exemple dendrogramme 47 Seuil 36

  48. Exemple dendrogramme 48 Seuil 29

  49. 49 CAH sur des séries temporelles Value Time M21 et

    M22 M20
  50. 50 CAH sur des séries temporelles Anomalie ? 2 manœuvres

    d’un type particulier ou 2 anomalies ? Que représente ces deux groupes de manœuvres bien distincts ? Est-ce normal ?
  51. Clusters 51 M15 M20 M21 et M22

  52. 52 CAH sur des séries temporelles multivariées Paramètre 1 Paramètre

    2
  53. Dendrogramme 53

  54. 54 Paramètre 1 Paramètre 2

  55. Conclusion 55 Le CAH basé sur des matrices de distance

    utilisant la Dynamic time warping avec en option la normalisation des séries temporelle remplit tous les critères que nous souhaitions au départ.