Upgrade to Pro — share decks privately, control downloads, hide ads and more …

(2022) Quand une coïncidence est-elle le fruit ...

Roger Mansuy
December 06, 2022

(2022) Quand une coïncidence est-elle le fruit du hasard?

Conférence grand public autour de la formule de Bayes donnée lors du 14ème festival Les Estiennales à l'école Estienne, le 7 décembre 2022

Roger Mansuy

December 06, 2022
Tweet

More Decks by Roger Mansuy

Other Decks in Science

Transcript

  1. Introduction Coïncidence: Simultanéité fortuite (de deux ou plusieurs événements ou

    circonstances). Une simple, curieuse, frappante, remarquable, singulière coïncidence; c’est pure coïncidence; quelle coïncidence! Par une heureuse coïncidence. Synon. hasard, rencontre, concours de circonstances Source: Trésor de la langue française informatisé
  2. 1er octobre 2022, 9:05 p.m. tirage du Grand Lotto de

    Philippine Charity Sweepstakes Office
  3. 3 décembre 2022, 9:05 p.m. tirage du Grand Lotto de

    Philippine Charity Sweepstakes Office
  4. Rapport de MM. les experts Appel-Darboux-Poincaré Si l’on met en

    évidence certaines coïncidences, et qu’on montre qu’il y avait a priori peu de chances pour qu’elles se produisent, avons-nous le droit de conclure qu’elles ne peuvent être l’effet du hasard?
  5. Rapport de MM. les experts Appel-Darboux-Poincaré Si l’on met en

    évidence certaines coïncidences, et qu’on montre qu’il y avait a priori peu de chances pour qu’elles se produisent, avons-nous le droit de conclure qu’elles ne peuvent être l’effet du hasard? [...] Nous en avons assez dit pour faire comprendre la nécessité d’une base de raisonnement plus solide. C’est ce que les fondateurs du calculs des probabilités ont cherché pour les questions de ce genre, mais nous ne pouvons l’expliquer sans entrer dans quelques détails techniques.
  6. Rapport de MM. les experts Appel-Darboux-Poincaré Si l’on met en

    évidence certaines coïncidences, et qu’on montre qu’il y avait a priori peu de chances pour qu’elles se produisent, avons-nous le droit de conclure qu’elles ne peuvent être l’effet du hasard? [...] Nous en avons assez dit pour faire comprendre la nécessité d’une base de raisonnement plus solide. C’est ce que les fondateurs du calculs des probabilités ont cherché pour les questions de ce genre, mais nous ne pouvons l’expliquer sans entrer dans quelques détails techniques. Ils ont distingué la probabilité des causes et la probabilité des effets.
  7. Rapport de MM. les experts Appel-Darboux-Poincaré Pour pouvoir calculer, d’après

    un événement constaté, la probabilité d’une cause, il nous faut plusieurs données: 1. Il faut savoir qu’elle était a priori, avant l’événement, la probabilité de cette cause. 2. Il faut savoir ensuite quelle serait, pour chacune des causes possibles, la probabilité de l’événement constaté.
  8. P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) +

    P(E|C2 )P(C2 ) • P(C1 ): probabilité de la cause numéro 1
  9. P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) +

    P(E|C2 )P(C2 ) • P(C1 ): probabilité de la cause numéro 1 • P(C2 ): probabilité de la cause numéro 2
  10. P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) +

    P(E|C2 )P(C2 ) • P(C1 ): probabilité de la cause numéro 1 • P(C2 ): probabilité de la cause numéro 2 • P(E|C1 ): probabilité de l’effet sachant pour la cause numéro 1
  11. P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) +

    P(E|C2 )P(C2 ) • P(C1 ): probabilité de la cause numéro 1 • P(C2 ): probabilité de la cause numéro 2 • P(E|C1 ): probabilité de l’effet sachant pour la cause numéro 1 • P(E|C2 ): probabilité de l’effet sachant pour la cause numéro 2
  12. P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) +

    P(E|C2 )P(C2 ) • P(C1 ): probabilité de la cause numéro 1 • P(C2 ): probabilité de la cause numéro 2 • P(E|C1 ): probabilité de l’effet sachant pour la cause numéro 1 • P(E|C2 ): probabilité de l’effet sachant pour la cause numéro 2 • P(C1 |E): probabilité de la cause numéro 1 sachant l’effet
  13. Rapport de MM. les experts Appel-Darboux-Poincaré Pour pouvoir calculer, d’après

    un événement constaté, la probabilité d’une cause P(C1 |E), il nous faut plusieurs données: 1. Il faut savoir qu’elle était a priori, avant l’événement, la probabilité de cette cause. P(C1 ) et P(C2 ) 2. Il faut savoir ensuite quelle serait, pour chacune des causes possibles, la probabilité de l’événement constaté. P(E|C1 ) et P(E|C2 ) P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) + P(E|C2 )P(C2 )
  14. Je viens de faire un test médical et je reçois

    un résultat positif; suis-je malade?
  15. Je viens de faire un test médical et je reçois

    un résultat positif; suis-je malade? • Cause C1: je suis malade • Cause C2: je ne suis pas malade • Effet E: le test est positif
  16. Je viens de faire un test médical et je reçois

    un résultat positif; suis-je malade? • Cause C1: je suis malade • Cause C2: je ne suis pas malade • Effet E: le test est positif • P(C1 ): probabilité d’être malade • P(C2 ): probabilité d’être sain • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain • P(C1 |E): probabilité d’être malade sachant que le test est positif
  17. • P(C1 ): probabilité d’être malade • P(C2 ): probabilité

    d’être sain • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain
  18. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain
  19. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain ⇝ 0, 999 • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain
  20. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain ⇝ 0, 999 • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain
  21. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain ⇝ 0, 999 • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002
  22. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain ⇝ 0, 999 • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002 La probabilité d’être malade sachant que le test est positif est P(C1 |E) = 0, 99 × 0, 001 0, 99 × 0, 001 + 0, 002 × 0, 999
  23. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain ⇝ 0, 999 • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002 La probabilité d’être malade sachant que le test est positif est P(C1 |E) = 0, 99 × 0, 001 0, 99 × 0, 001 + 0, 002 × 0, 999 ≃ 0, 331
  24. Après ce premier test positif, je fais un nouveau test

    médical et je reçois encore un résultat positif; suis-je malade?
  25. Après ce premier test positif, je fais un nouveau test

    médical et je reçois encore un résultat positif; suis-je malade? • P(C1 ): probabilité d’être malade • P(C2 ): probabilité d’être sain • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002
  26. Après ce premier test positif, je fais un nouveau test

    médical et je reçois encore un résultat positif; suis-je malade? • P(C1 ): probabilité d’être malade ⇝ 0, 331 NEW!!! • P(C2 ): probabilité d’être sain ⇝ 0, 669 NEW!!! • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002
  27. Après ce premier test positif, je fais un nouveau test

    médical et je reçois encore un résultat positif; suis-je malade? • P(C1 ): probabilité d’être malade ⇝ 0, 331 NEW!!! • P(C2 ): probabilité d’être sain ⇝ 0, 669 NEW!!! • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002 La probabilité d’être malade sachant que le test est positif est P(C1 |E) = 0, 99 × 0, 331 0, 99 × 0, 331 + 0, 002 × 0, 669
  28. Après ce premier test positif, je fais un nouveau test

    médical et je reçois encore un résultat positif; suis-je malade? • P(C1 ): probabilité d’être malade ⇝ 0, 331 NEW!!! • P(C2 ): probabilité d’être sain ⇝ 0, 669 NEW!!! • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002 La probabilité d’être malade sachant que le test est positif est P(C1 |E) = 0, 99 × 0, 331 0, 99 × 0, 331 + 0, 002 × 0, 669 ≃ 0, 987
  29. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Face en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée?
  30. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Face en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 0, P(E|C2 ) = 1 2 .
  31. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Face en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 0, P(E|C2 ) = 1 2 . La probabilité d’avoir joué avec la pièce truquée sachant ce résultat est P(C1 |E) = 0 × 1 2 0 × 1 2 + 1 2 × 1 2 = 0.
  32. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Pile en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée?
  33. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Pile en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 1, P(E|C2 ) = 1 2 .
  34. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Pile en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 1, P(E|C2 ) = 1 2 . La probabilité d’avoir joué avec la pièce truquée sachant ce résultat est P(C1 |E) = 1 × 1 2 1 × 1 2 + 1 2 × 1 2 = 2 3 ≃ 0, 67.
  35. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient 7 Piles en sept lancers de suite Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée?
  36. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient 7 Piles en sept lancers de suite Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 1, P(E|C2 ) = 1 27 .
  37. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient 7 Piles en sept lancers de suite Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 1, P(E|C2 ) = 1 27 . La probabilité d’avoir joué avec la pièce truquée sachant ce résultat est P(C1 |E) = 1 × 1 2 1 × 1 2 + 1 27 × 1 2 = 128 129 ≃ 0, 992.
  38. Nombre de Piles 1 2 3 4 5 6 7

    · · · P(C1 |E) 0,67 0,80 0,89 0,94 0,97 0,98 0,99 · · ·
  39. Retour sur l’affaire Sally Clark Selon le pédiatre Roy Meadows

    (entendu au procès), la probabilité de deux morts naturelles de nourrisson au sein d’un même foyer est 1 73000000 . Cette probabilité est tellement faiblement qu’elle incite intuitivement à rejeter l’hypothèse d’une mère innocente (sophisme du procureur).
  40. Royal Statistical Society, 23 Octobre 2001 In the recent highly-publicised

    case of R v. Sally Clark, a medical expert witness drew on published studies to obtain a figure for the frequency of sudden infant death syndrome (SIDS, or ”cot death”) in families having some of the characteristics of the defendant’s family. He went on to square this figure to obtain a value of 1 in 73 million for the frequency of two cases of SIDS in such a family. This approach is, in general, statistically invalid. It would only be valid if SIDS cases arose independently within families, an assumption that would need to be justified empirically. Not only was no such empirical justification provided in the case, but there are very strong a priori reasons for supposing that the assumption will be false. There may well be unknown genetic or environmental factors that predispose families to SIDS, so that a second case within the family becomes much more likely. The well-publicised figure of 1 in 73 million thus has no statistical basis.
  41. Examinons la question de la culpabilité avec la formule de

    Bayes. • Cause C1: Sally Clarke est meurtrière • Cause C2: Sally Clarke est innocente • Effet E: les deux enfants meurent en bas âge
  42. Déclaration des Droits de l’Homme et du Citoyen de 1789

    Art. 9. Tout homme étant présumé innocent jusqu’à ce qu’il ait été déclaré coupable Code de procédure pénale Articles préliminaires. III.-Toute personne suspectée ou poursuivie est présumée innocente tant que sa culpabilité n’a pas été établie.
  43. Déclaration des Droits de l’Homme et du Citoyen de 1789

    Art. 9. Tout homme étant présumé innocent jusqu’à ce qu’il ait été déclaré coupable Code de procédure pénale Articles préliminaires. III.-Toute personne suspectée ou poursuivie est présumée innocente tant que sa culpabilité n’a pas été établie. P(C1 ) = 1 2000000000 , Estimation par Pr. Alicia L. Carriquiry, directrice du centre de statistiques et d’applications en matière de preuves médico-légales
  44. Déclaration des Droits de l’Homme et du Citoyen de 1789

    Art. 9. Tout homme étant présumé innocent jusqu’à ce qu’il ait été déclaré coupable Code de procédure pénale Articles préliminaires. III.-Toute personne suspectée ou poursuivie est présumée innocente tant que sa culpabilité n’a pas été établie. P(C1 ) = 1 2000000000 , P(C2 ) = 1 − 1 2000000000 Estimation par Pr. Alicia L. Carriquiry, directrice du centre de statistiques et d’applications en matière de preuves médico-légales
  45. Par définition, P(E|C1 ) = 1. D’après Roy Meadows, P(E|C2

    ) = 1 73000000 . P(C1 |E) = 1 × 1 2000000000 1 × 1 2000000000 + 1 73000000 × 1999999999 2000000000
  46. Par définition, P(E|C1 ) = 1. D’après Roy Meadows, P(E|C2

    ) = 1 73000000 . P(C1 |E) = 1 × 1 2000000000 1 × 1 2000000000 + 1 73000000 × 1999999999 2000000000 ≃ 0, 035
  47. En admettant la valeur (erronée) proposée par Roy Meadows, quelle

    serait la valeur de P(C1 ) pour que la probabilité donnée par la formule de Bayes soit 1 2 ?
  48. En admettant la valeur (erronée) proposée par Roy Meadows, quelle

    serait la valeur de P(C1 ) pour que la probabilité donnée par la formule de Bayes soit 1 2 ? Après calculs, on obtient P(C1 ) = 1, 3 × 10−8.
  49. En admettant la valeur (erronée) proposée par Roy Meadows, quelle

    serait la valeur de P(C1 ) pour que la probabilité donnée par la formule de Bayes soit 1 2 ? Après calculs, on obtient P(C1 ) = 1, 3 × 10−8. Dans cette formule, pour obtenir une forte probabilité de culpabilité, il faut que la probabilité P(E|C2 ) > > P(C1 ).
  50. Conclusion • La formule de Bayes permet dans une certaine

    modélisation de calculer des probabilités de causes sachant un effet observé.
  51. Conclusion • La formule de Bayes permet dans une certaine

    modélisation de calculer des probabilités de causes sachant un effet observé. • Il faut estimer les probabilités a priori (sans tenir compte de l’effet).
  52. Conclusion • La formule de Bayes permet dans une certaine

    modélisation de calculer des probabilités de causes sachant un effet observé. • Il faut estimer les probabilités a priori (sans tenir compte de l’effet). • Il faut estimer les probabilités que chaque cause entraîne l’effet.
  53. Rapport de MM. les experts Appel-Darboux-Poincaré Le calcul des probabilités

    n’est pas, comme on paraît le croire, une science merveilleuse qui dispense le savant d’avoir du bon sens.