$30 off During Our Annual Pro Sale. View Details »

(2023) Probabilités incomprises

Roger Mansuy
February 22, 2023

(2023) Probabilités incomprises

Exposé grand public sur les probabilités incomprises et la formule de Bayes à la mairie de Luxeuil-les-Bains le 23 février 2023

Roger Mansuy

February 22, 2023
Tweet

More Decks by Roger Mansuy

Other Decks in Education

Transcript

  1. Introduction La théorie des probabilités n’est au fond, que le

    bon sens réduit au calcul : elle fait apprécier avec exactitude ce que les esprits justes sentent par une sorte d’instinct, sans qu’ils puissent sou- vent s’en rendre compte. Pierre-Simon de Laplace Essai philosophique sur les probabilités 1814
  2. Grand Lotto de Philippine Charity Sweepstakes Office 0 vainqueur 0

    vainqueur 0 vainqueur 0 vainqueur 433 vainqueurs
  3. Le sénateur Aquilino ”Koko” Pimentel III a demandé une enquête

    officielle sur le tirage du 1er octobre 2022 de PCSO car il estimait que les chances que plus de 400 personnes obtiennent les mêmes numéros gagnants étaient trop faibles pour que cette coïncidence soit le fruit du hasard. Pero ’yung 433 ang mananalo… supposed to be ang chances mo diyan, one in how many billions eh. Ibig sabihin, ganun dapat kahirap tamaan ‘yan. To say na 433 ang tumama, there is something suspicious
  4. La probabilité de gain après changement de porte est 1

    2 les deux portes restantes ont initialement autant de chances de cacher la voiture donc 1 2 chacune.
  5. La probabilité de gain après changement de porte est 2

    3 la probabilité que la voiture soit derrière la porte initialement choisie est 1 3 donc la probabilité qu’elle soit derrière les deux autres est 2 3 . Or, une des autres portes est ouverte donc la probabilité qu’elle soit derrière l’autre porte fermée est 2 3 .
  6. La probabilité de gain après changement de porte est 1

    2 les deux portes restantes ont initialement autant de chances de cacher la voiture donc 1 2 chacune. La probabilité de gain après changement de porte est 2 3 la probabilité que la voiture soit derrière la porte initialement choisie est 1 3 donc la probabilité qu’elle soit derrière les deux autres est 2 3 . Or, une des autres portes est ouverte donc la probabilité qu’elle soit derrière l’autre porte fermée est 2 3 .
  7. Rapport de MM. les experts Appel-Darboux-Poincaré Si l’on met en

    évidence certaines coïncidences, et qu’on montre qu’il y avait a priori peu de chances pour qu’elles se produisent, avons-nous le droit de conclure qu’elles ne peuvent être l’effet du hasard?
  8. Rapport de MM. les experts Appel-Darboux-Poincaré Si l’on met en

    évidence certaines coïncidences, et qu’on montre qu’il y avait a priori peu de chances pour qu’elles se produisent, avons-nous le droit de conclure qu’elles ne peuvent être l’effet du hasard? [...] Nous en avons assez dit pour faire comprendre la nécessité d’une base de raisonnement plus solide. C’est ce que les fondateurs du calculs des probabilités ont cherché pour les questions de ce genre, mais nous ne pouvons l’expliquer sans entrer dans quelques détails techniques.
  9. Rapport de MM. les experts Appel-Darboux-Poincaré Si l’on met en

    évidence certaines coïncidences, et qu’on montre qu’il y avait a priori peu de chances pour qu’elles se produisent, avons-nous le droit de conclure qu’elles ne peuvent être l’effet du hasard? [...] Nous en avons assez dit pour faire comprendre la nécessité d’une base de raisonnement plus solide. C’est ce que les fondateurs du calculs des probabilités ont cherché pour les questions de ce genre, mais nous ne pouvons l’expliquer sans entrer dans quelques détails techniques. Ils ont distingué la probabilité des causes et la probabilité des effets.
  10. Rapport de MM. les experts Appel-Darboux-Poincaré Pour pouvoir calculer, d’après

    un événement constaté, la probabilité d’une cause, il nous faut plusieurs données: 1. Il faut savoir quelle était a priori, avant l’événement, la probabilité de cette cause. 2. Il faut savoir ensuite quelle serait, pour chacune des causes possibles, la probabilité de l’événement constaté.
  11. P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) +

    P(E|C2 )P(C2 ) • P(C1 ): probabilité de la cause numéro 1
  12. P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) +

    P(E|C2 )P(C2 ) • P(C1 ): probabilité de la cause numéro 1 • P(C2 ): probabilité de la cause numéro 2
  13. P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) +

    P(E|C2 )P(C2 ) • P(C1 ): probabilité de la cause numéro 1 • P(C2 ): probabilité de la cause numéro 2 • P(E|C1 ): probabilité de l’effet sachant pour la cause numéro 1
  14. P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) +

    P(E|C2 )P(C2 ) • P(C1 ): probabilité de la cause numéro 1 • P(C2 ): probabilité de la cause numéro 2 • P(E|C1 ): probabilité de l’effet sachant pour la cause numéro 1 • P(E|C2 ): probabilité de l’effet sachant pour la cause numéro 2
  15. P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) +

    P(E|C2 )P(C2 ) • P(C1 ): probabilité de la cause numéro 1 • P(C2 ): probabilité de la cause numéro 2 • P(E|C1 ): probabilité de l’effet sachant pour la cause numéro 1 • P(E|C2 ): probabilité de l’effet sachant pour la cause numéro 2 • P(C1 |E): probabilité de la cause numéro 1 sachant l’effet
  16. Rapport de MM. les experts Appel-Darboux-Poincaré Pour pouvoir calculer, d’après

    un événement constaté, la probabilité d’une cause P(C1 |E), il nous faut plusieurs données: 1. Il faut savoir qu’elle était a priori, avant l’événement, la probabilité de cette cause. P(C1 ) et P(C2 ) 2. Il faut savoir ensuite quelle serait, pour chacune des causes possibles, la probabilité de l’événement constaté. P(E|C1 ) et P(E|C2 ) P(C1 |E) = P(E|C1 )P(C1 ) P(E|C1 )P(C1 ) + P(E|C2 )P(C2 )
  17. Je viens de faire un test médical et je reçois

    un résultat positif; suis-je malade?
  18. Je viens de faire un test médical et je reçois

    un résultat positif; suis-je malade? • Cause C1: je suis malade • Cause C2: je ne suis pas malade • Effet E: le test est positif
  19. Je viens de faire un test médical et je reçois

    un résultat positif; suis-je malade? • Cause C1: je suis malade • Cause C2: je ne suis pas malade • Effet E: le test est positif • P(C1 ): probabilité d’être malade • P(C2 ): probabilité d’être sain • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain • P(C1 |E): probabilité d’être malade sachant que le test est positif
  20. • P(C1 ): probabilité d’être malade • P(C2 ): probabilité

    d’être sain • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain
  21. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain
  22. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain ⇝ 0, 999 • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain
  23. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain ⇝ 0, 999 • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain
  24. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain ⇝ 0, 999 • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002
  25. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain ⇝ 0, 999 • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002 La probabilité d’être malade sachant que le test est positif est P(C1 |E) = 0, 99 × 0, 001 0, 99 × 0, 001 + 0, 002 × 0, 999
  26. • P(C1 ): probabilité d’être malade ⇝ 0, 001 •

    P(C2 ): probabilité d’être sain ⇝ 0, 999 • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002 La probabilité d’être malade sachant que le test est positif est P(C1 |E) = 0, 99 × 0, 001 0, 99 × 0, 001 + 0, 002 × 0, 999 ≃ 0, 331
  27. Après ce premier test positif, je fais un nouveau test

    médical et je reçois encore un résultat positif; suis-je malade?
  28. Après ce premier test positif, je fais un nouveau test

    médical et je reçois encore un résultat positif; suis-je malade? • P(C1 ): probabilité d’être malade • P(C2 ): probabilité d’être sain • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002
  29. Après ce premier test positif, je fais un nouveau test

    médical et je reçois encore un résultat positif; suis-je malade? • P(C1 ): probabilité d’être malade ⇝ 0, 331 NEW!!! • P(C2 ): probabilité d’être sain ⇝ 0, 669 NEW!!! • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002
  30. Après ce premier test positif, je fais un nouveau test

    médical et je reçois encore un résultat positif; suis-je malade? • P(C1 ): probabilité d’être malade ⇝ 0, 331 NEW!!! • P(C2 ): probabilité d’être sain ⇝ 0, 669 NEW!!! • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002 La probabilité d’être malade sachant que le test est positif est P(C1 |E) = 0, 99 × 0, 331 0, 99 × 0, 331 + 0, 002 × 0, 669
  31. Après ce premier test positif, je fais un nouveau test

    médical et je reçois encore un résultat positif; suis-je malade? • P(C1 ): probabilité d’être malade ⇝ 0, 331 NEW!!! • P(C2 ): probabilité d’être sain ⇝ 0, 669 NEW!!! • P(E|C1 ): probabilité que le test soit positif sachant que l’on est malade ⇝ 0, 99 • P(E|C2 ): probabilité que le test soit positif sachant que l’on est sain ⇝ 0, 002 La probabilité d’être malade sachant que le test est positif est P(C1 |E) = 0, 99 × 0, 331 0, 99 × 0, 331 + 0, 002 × 0, 669 ≃ 0, 987
  32. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Face en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée?
  33. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Face en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 0, P(E|C2 ) = 1 2 .
  34. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Face en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 0, P(E|C2 ) = 1 2 . La probabilité d’avoir joué avec la pièce truquée sachant ce résultat est P(C1 |E) = 0 × 1 2 0 × 1 2 + 1 2 × 1 2 = 0.
  35. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Pile en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée?
  36. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Pile en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 1, P(E|C2 ) = 1 2 .
  37. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient Pile en un lancer Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 1, P(E|C2 ) = 1 2 . La probabilité d’avoir joué avec la pièce truquée sachant ce résultat est P(C1 |E) = 1 × 1 2 1 × 1 2 + 1 2 × 1 2 = 2 3 ≃ 0, 67.
  38. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient sept (7) Piles en sept lancers de suite Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée?
  39. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient sept (7) Piles en sept lancers de suite Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 1, P(E|C2 ) = 1 27 .
  40. • Cause C1: la pièce est truquée avec deux côtés

    Pile • Cause C2: la pièce est ordinaire • Effet E: on obtient sept (7) Piles en sept lancers de suite Sachant que l’on observe E, quelle est la probabilité que l’on joue avec la pièce truquée? P(C1 ) = 1 2 , P(C2 ) = 1 2 , P(E|C1 ) = 1, P(E|C2 ) = 1 27 . La probabilité d’avoir joué avec la pièce truquée sachant ce résultat est P(C1 |E) = 1 × 1 2 1 × 1 2 + 1 27 × 1 2 = 128 129 ≃ 0, 992.
  41. Nombre de Piles 1 2 3 4 5 6 7

    · · · P(C1 |E) 0,67 0,80 0,89 0,94 0,97 0,98 0,99 · · ·
  42. Au procès à Chester Crown Court en novembre 1999, le

    pédiatre Roy Meadows annonce que la probabilité de deux morts naturelles de nourrisson au sein d’un même foyer vaut 1 73000000 .
  43. Au procès à Chester Crown Court en novembre 1999, le

    pédiatre Roy Meadows annonce que la probabilité de deux morts naturelles de nourrisson au sein d’un même foyer vaut 1 73000000 . Cette probabilité est tellement faible qu’elle incite intuitivement à rejeter l’hypothèse d’une mère innocente (sophisme du procureur).
  44. Communiqué de la Royal Statistical Society, 23 Octobre 2001 In

    the recent highly-publicised case of R v. Sally Clark, a medical expert witness drew on published studies to obtain a figure for the frequency of sudden infant death syndrome (SIDS, or ”cot death”) in families having some of the characteristics of the defendant’s family. He went on to square this figure to obtain a value of 1 in 73 million for the frequency of two cases of SIDS in such a family. This approach is, in general, statistically invalid. It would only be valid if SIDS cases arose independently within families, an assumption that would need to be justified empirically. Not only was no such empirical justification provided in the case, but there are very strong a priori reasons for supposing that the assumption will be false. There may well be unknown genetic or environmental factors that predispose families to SIDS, so that a second case within the family becomes much more likely. The well-publicised figure of 1 in 73 million thus has no statistical basis.
  45. Examinons la question de la culpabilité avec la formule de

    Bayes. • Cause C1: Sally Clarke est meurtrière • Cause C2: Sally Clarke est innocente • Effet E: les deux enfants meurent en bas âge
  46. Examinons la question de la culpabilité avec la formule de

    Bayes. • Cause C1: Sally Clarke est meurtrière • Cause C2: Sally Clarke est innocente • Effet E: les deux enfants meurent en bas âge Pour appliquer la formule de Bayes afin de calculer P(C1 |E), il faut connaître P(C1 ), P(C2 ), P(E|C1 ), P(E|C2 )
  47. Déclaration des Droits de l’Homme et du Citoyen de 1789

    Art. 9. Tout homme étant présumé innocent jusqu’à ce qu’il ait été déclaré coupable Code de procédure pénale Articles préliminaires. III.-Toute personne suspectée ou poursuivie est présumée innocente tant que sa culpabilité n’a pas été établie.
  48. Déclaration des Droits de l’Homme et du Citoyen de 1789

    Art. 9. Tout homme étant présumé innocent jusqu’à ce qu’il ait été déclaré coupable Code de procédure pénale Articles préliminaires. III.-Toute personne suspectée ou poursuivie est présumée innocente tant que sa culpabilité n’a pas été établie. P(C1 ) = 1 2000000000 , Estimation par Pr. Alicia L. Carriquiry, directrice du centre de statistiques et d’applications en matière de preuves médico-légales, Iowa State University
  49. Déclaration des Droits de l’Homme et du Citoyen de 1789

    Art. 9. Tout homme étant présumé innocent jusqu’à ce qu’il ait été déclaré coupable Code de procédure pénale Articles préliminaires. III.-Toute personne suspectée ou poursuivie est présumée innocente tant que sa culpabilité n’a pas été établie. P(C1 ) = 1 2000000000 , P(C2 ) = 1 − 1 2000000000 Estimation par Pr. Alicia L. Carriquiry, directrice du centre de statistiques et d’applications en matière de preuves médico-légales, Iowa State University
  50. Par définition, P(E|C1 ) = 1. D’après Roy Meadows, P(E|C2

    ) = 1 73000000 . P(C1 |E) = 1 × 1 2000000000 1 × 1 2000000000 + 1 73000000 × 1999999999 2000000000
  51. Par définition, P(E|C1 ) = 1. D’après Roy Meadows, P(E|C2

    ) = 1 73000000 . P(C1 |E) = 1 × 1 2000000000 1 × 1 2000000000 + 1 73000000 × 1999999999 2000000000 ≃ 0, 035
  52. Sally Clark a été innocentée (après trois ans en prison)

    lors de la deuxième procé- dure d’appel en 2003.
  53. Sally Clark a été innocentée (après trois ans en prison)

    lors de la deuxième procé- dure d’appel en 2003. Elle ne s’est jamais remise, a sombré dans l’alcoolisme et est morte en 2007.
  54. Sally Clark a été innocentée (après trois ans en prison)

    lors de la deuxième procé- dure d’appel en 2003. Elle ne s’est jamais remise, a sombré dans l’alcoolisme et est morte en 2007. À la suite de cette affaire, le procureur général a ordonné la révision de cen- taines d’autres cas: deux autres femmes, Angela Cannings et Donna Anthony, ont vu leur condamnation annulée.
  55. Conclusion • Il est difficile d’appréhender correctement les probabilités même

    avec du bon sens... et notamment les probabilités ”conditionnelles.”
  56. Conclusion • Il est difficile d’appréhender correctement les probabilités même

    avec du bon sens... et notamment les probabilités ”conditionnelles.” • La formule de Bayes permet dans une certaine modélisation de calculer des probabilités de causes sachant un effet observé.
  57. Conclusion • Il est difficile d’appréhender correctement les probabilités même

    avec du bon sens... et notamment les probabilités ”conditionnelles.” • La formule de Bayes permet dans une certaine modélisation de calculer des probabilités de causes sachant un effet observé. • Pour l’appliquer il faut estimer les probabilités a priori (sans tenir compte de l’effet) et les probabilités que chaque cause entraîne l’effet.