Effet probabilité Inversée

L’effet probabilité Inversée est une manière trompeuse de présenter les chiffres en jouant sur les probabilités conditionnelles. Notre collègue physicien Florent Tournus a écrit en 2008 un article pour l’Observatoire zététique intitulé « Inconditionnel des probabilités conditionnelles« , si clair que que nous le reproduisons ici. Merci à lui !

Note : un groupe de doctorants-moniteurs du CIES de Grenoble a réalisé en 2010 un Zétéclip sur cet effet. Voir ici.


Les chiffres sont souvent utilisés à des fins de manipulation, de marketing par exemple (les fameux prix en 99 euros ou 99 centimes [1]). Tout le monde le sait, ce n’est pas un scoop. Et pourtant, même en le sachant, il est difficile de ne pas se laisser influencer, de ne pas tomber dans certains « pièges ». Essayer de garder un regard critique sur les chiffres qu’on nous présente (sondages etc.) demande une vigilance permanente. Je voudrais aborder ici un sujet qui, bien qu’éloigné du « paranormal », permet d’exercer son esprit critique : les probabilités ou proportions qui sont données de manière à être interprétées à tort, à créer un fort impact. Cet impact s’appuie sur une mauvaise perception des chiffres avancés, par ce que j’appellerai un effet de « probabilité inversée ».
L’exemple peut-être le plus fameux, mais aussi le plus caricatural – ce qui fait que personne ne tombe (il faut espérer) dans le piège de la « probabilité inversée » – est ce slogan de la Française des jeux : « 100 % des gagnants ont tenté leur chance ». Telle quelle, cette phrase n’apporte en fait aucune information [2] : si on a gagné, c’est forcément qu’on a joué ! Du coup, évidemment, personne n’a gagné sans avoir joué. De manière amusante, on pourrait aussi prendre comme slogan « 100 % des perdants ont tenté leur chance », mais c’est moins vendeur… Ce qui intéresse le joueur, ou le joueur potentiel que la Française des jeux espère appâter, c’est la probabilité de gagner sachant qu’il a joué, et pas la probabilité inverse, c’est-à-dire celle qu’il ait joué sachant qu’il a gagné ! En notation mathématique, si on note A l’événement « je gagne » et B l’événement « je joue », la première probabilité s’écrit [3] P(A/B) qui se lit « probabilité P de A, sachant B » et la seconde P(B/A). Ces probabilités sont appelées probabilités conditionnelles [4]. Vous le voyez tout de suite, P(A/B) n’est absolument pas égal à P(B/A) [5] : la probabilité que je gagne sachant que j’ai joué est extrêmement faible, tandis que la probabilité que j’aie joué sachant que j’ai gagné est de 1 (c’est-à-dire 100 %).
L’effet de « probabilité inversée » est donc le suivant : prendre (à tort) la probabilité de A sachant B, comme probabilité de B sachant A. Bien que ces deux probabilités soient liées, la donnée de l’une d’entre elles (sans autre information) ne permet pas de connaître l’autre. Au mieux, procéder de la sorte n’apporte aucune information réellement utile, au pire cela relève d’une sorte de manipulation : on sait pertinemment quelle est la probabilité qui intéresse le public visé, mais on lui fournit la probabilité de la situation inverse. Dans tous les cas, on n’a pas donné l’information espérée mais on a créé une impression de l’avoir (au moins de manière qualitative).
Prenons un exemple moins trivial de slogan avec « probabilité inversée », que l’on a pu voir sur les panneaux d’autoroutes : « Pas de ceinture : 2 morts sur 5 ». Quel est le but d’un tel message ? Il s’agit clairement d’inciter à mettre sa ceinture de sécurité, en faisant croire que ces chiffres montrent que l’on a bien moins de chances de mourir lorsqu’on porte sa ceinture que lorsqu’on ne la porte pas. Certains auront même vite fait de penser que deux personnes sur cinq qui ne mettent pas leur ceinture meurent  [6]. « C’est faux mais ce n’est pas grave, ça devrait les inciter à mettre leur ceinture » doivent penser les personnes à l’origine de la diffusion de ce message. Remarquons tout d’abord qu’on se doute bien, sans avoir besoin de chiffres, que la ceinture de sécurité protège un minimum ! Ça, c’est du qualitatif. Quant à l’aspect quantitatif, on a l’impression que ce message nous l’indique. Or il n’en est rien, comme on peut s’en rendre compte en regardant de plus près.
J’ouvre une parenthèse. Dans cet exemple, je ne suis même pas convaincu que l’effet « probabilité inversée » fonctionne très bien. On peut en effet convaincre quelqu’un (avec un raisonnement biaisé) que si deux morts sur cinq n’avaient pas mis leur ceinture, alors trois morts sur cinq avaient bien mis leur ceinture [7]. Ceci signifie qu’il y a plus de morts avec ceinture que sans, et donc (c’est là que le raisonnement est faux !) qu’on a plus de chances de mourir quand on met sa ceinture que lorsqu’on ne la met pas [8] ! Je ferme la parenthèse.

Quelles sont les probabilités (ou proportions) qu’il faudrait connaître pour savoir à quel point mettre sa ceinture protège de la mort ? Il faudrait connaître la probabilité de mourir sachant qu’on a sa ceinture, et la comparer à la probabilité de mourir sachant qu’on n’a pas sa ceinture. C’est-à-dire, en notant A l’événement « mourir dans un accident de voiture », B « ne pas mettre sa ceinture » et C « mettre sa ceinture », comparer P(A/B) à P(A/C). Mais que nous donne le message « Pas de ceinture : 2 morts sur 5 » ? Ni P(A/C), ni même P(A/B), mais P(B/A) (la probabilité de ne pas avoir mis sa ceinture, sachant qu’on est mort d’un accident de voiture). Comment donc comparer P(A/B) à P(A/C) en connaissant uniquement P(B/A) ? Cela semble quasiment impossible ! Et pourtant, on sent bien malgré tout  [9] que le slogan indique qu’on a plus de chances de survivre à un accident de voiture quand on met sa ceinture de sécurité. Cela vient peut-être du fait qu’on a une certaine « intuition » des probabilités mises en jeu, qui relient justement P(B/A) à P(A/B) [et P(A/C)].

Prenons notre courage à deux mains et lançons-nous dans une écriture mathématique du problème. Dans la suite, nous allons considérer que les probabilités sont confondues avec les proportions effectivement mesurées sur toute la population ou du moins, sur une grande population [10]. Commençons par préciser quelques notations : nous allons noter N le nombre total d’automobilistes [11], qui se répartissent en NB qui ne mettent pas leur ceinture et NC qui la mettent (on a donc NB + NC = N) et NA le nombre d’automobilistes qui sont morts dans un accident de voiture, qui se répartissent en NA&B qui n’avaient pas mis leur ceinture et NA&C qui l’avaient mise (on a donc NA&B + NA&C = NA). Les différentes probabilités correspondent alors aux proportions suivantes :

P(A&B) = NA&B/N (probabilité d’avoir A et B, « A&B » signifiant « A et B »)
P(B/A) = NA&B/NA et P(A/B) =NA&B/NB
P(A) = NA / N et P(B) = NB / N
P(A) = NA et P(B) = NB
Ces expressions nous permettent de retrouver la formule reliant les différentes probabilités :

P(A&B) = P(B) × P(A/B)

Celle-ci se comprend très bien : en effet, la probabilité d’avoir A et B est donnée par la probabilité d’avoir B, multipliée par la probabilité d’avoir A sachant qu’on a B. En écrivant cela on considère en quelque sorte que pour avoir A et B, on commence par réaliser la condition B, puis on réalise A sachant qu’on a déjà B. On aurait tout aussi bien pu faire passer A « avant » B et écrire que la probabilité d’avoir A et B est égale à la probabilité d’avoir A, multipliée par celle d’avoir B sachant A. Ceci revient à écrire cette seconde égalité, qui est tout aussi vraie :

P(A&B) = P(A) × P(B/A)

En identifiant les deux expressions de P(A&B), le lien entre P(A/B) et P(B/A) apparaît [12] :

P(A) × P(B/A) = P(B) × P(A/B)

ce qui donne :
P(A/B) = P(B/A) × (P(A) / P(B))

Revenons à notre exemple des accidents de la route. Pour connaître la probabilité de mourir sachant qu’on n’a pas mis sa ceinture [c’est-à-dire P(A/B)], à partir de P(B/A) (celle donnée par le message : la probabilité de ne pas avoir sa ceinture, sachant qu’on est mort), il faut connaître P(A) et P(B), c’est-à-dire respectivement la probabilité de mourir d’un accident de la route (indépendamment du fait qu’on ait mis ou pas sa ceinture) et celle de ne pas mettre sa ceinture. Comme nous n’avons pas ces données, nous ne pouvons pas vraiment évaluer P(A/B). Par contre, étant donné que le but du message était de nous « faire peur », de nous inciter à mettre la ceinture, on peut essayer de comparer cette probabilité à celle de mourir sachant qu’on a bien mis sa ceinture de sécurité [c’est-à-dire P(A/C)]. En suivant le même raisonnement que pour P(A/B), on arrive à l’égalité suivante :
 
P(A/C) = P(C/A) × (P(A) / P(C))

et en faisant le rapport de P(A/B) et P(A/C) on obtient :
P(A/B) / P(A/C) = P(B/A) / P(C/A) × P(C) / P(B)

On s’attend à ce que ce rapport soit plus grand que 1 (on a plus de chances de mourir si on n’a pas mis sa ceinture), mais de combien ? Ce que nous dit le message c’est que P(B/A)=2/5, ce qui nous permet de déduire que P(C/A)=3/5 (en effet, si deux morts sur cinq n’avaient pas de ceinture, les trois restants avaient leur ceinture  [13]). Du coup, avec l’information donnée par le message, on aboutit simplement à :
 
P(A/B) / P(A/C) = 2 / 3 ×P(C) = P(B)
 
et comme P(C)=1-P(B) [l’ensemble de la population se sépare en deux groupes uniquement : ceux qui ne mettent pas leur ceinture (B) et ceux qui la mettent (C)], cela peut s’écrire simplement :
 
P(A/B) / P(A/C) = 2 / 3 × (1 – P(B) / P(B))
 
Envisageons maintenant plusieurs cas. Si la proportion P(B) de gens qui conduisent sur l’autoroute sans mettre leur ceinture est de 2/5 on a alors (1-P(B))/P(B) = 3/2 et finalement P(A/B)=P(A/C). Autrement dit, mettre sa ceinture ou pas ne change rien à la probabilité qu’on a de mourir dans un accident ! Cela peut se voir directement d’après les proportions (sans même écrire les expressions mathématiques avec les probabilités conditionnelles) : si la proportion de gens qui ne mettent pas leur ceinture est la même parmi les morts (lors d’un accident de la route) que sur l’ensemble des automobilistes, alors finalement mettre ou non sa ceinture n’a pas d’incidence sur la probabilité de mourir.
En revanche, si la proportion de gens qui ne mettent pas leur ceinture est inférieure à 2/5, cela signifie que les automobilistes sans ceinture sont sur-représentés parmi les morts, et que P(A/B) > P(A/C). La probabilité de mourir est donc plus grande lorsqu’on ne met pas sa ceinture que lorsqu’on la met. Étant donnée que cette conclusion est celle à laquelle on s’attend, prendre le message « Pas de ceinture : 2 morts sur 5 » comme un encouragement à mettre sa ceinture de sécurité signifie qu’on estime implicitement que moins de deux personnes sur cinq ne mettent pas leur ceinture en voiture. En effet, l’information donnée par le message « Pas de ceinture : 2 morts sur 5 » implique qu’on a plus de chances de mourir lorsqu’on ne met pas sa ceinture, si et seulement si la proportion d’automobilistes sans ceinture est inférieure à 40 % (soit 2/5).
Comme quoi, la mise en garde n’est pas évidente (surtout quand on pense que le message est lu sur un panneau d’autoroute…) ! Le plus important, je trouve, est que la proportion donnée de 2/5 n’apporte finalement pas grand chose et qu’en particulier, elle ne permet absolument pas de chiffrer le risque supplémentaire de mourir lorsqu’on ne met pas sa ceinture. Notez que si la proportion de personnes ne mettant pas leur ceinture est connue [14], par exemple 1 sur 10, alors on peut calculer que
 
P(A/B) / P(A/C) = 2/3 × 9 = 6
 
Autrement dit, dans ce cas, ne pas mettre sa ceinture de sécurité revient à multiplier par 6 sa probabilité de mourir [15] ! Je trouve que ce genre de message est bien plus parlant, et quitte à donner un chiffre, sa signification apparaît ici immédiatement.
Le fait qu’on rencontre relativement souvent des messages faisant apparaître un effet de « probabilité inversée » vient peut-être du fait que toutes les données [par exemple ici, P(B)] ne sont pas connues [16]. En effet, il est relativement facile de mesurer la proportion de personnes sans ceinture parmi les morts, mais il est plus difficile de le faire parmi les vivants… Je pense plutôt que des proportions ou des probabilités inexploitables sont données sciemment, pour augmenter l’impact d’un message sur la cible visée. On peut d’ailleurs se poser la question de l’efficacité de ce procédé  [17] : finalement, que retiennent les gens ?
Je suis sûr que vous avez rencontré d’autres messages utilisant cet effet de « probabilité inversée ». Par exemple, il y a eu une campagne dans les journaux annonçant que « 80 % des victimes d’infarctus avant 45 ans sont fumeurs ». Beaucoup traduiront ça par : un fumeur a 80 % de chances de faire un infarctus avant 45 ans. Là encore, pour peu qu’on connaisse la proportion de fumeurs, on pouvait parfaitement transformer ce message en quelque chose comme « Fumer multiplie par 16 le risque de faire un infarctus avant 45 ans » (en faisant le même calcul que pour la ceinture de sécurité, et en considérant, de manière complètement arbitraire, que 20 % des gens sont des fumeurs).
Le procédé est parfois utilisé avec de bonnes intentions : sécurité routière, lutte contre le tabagisme, contre la prise de drogue… (Note de R. Monvoisin – Encore que : lutter contre une servitude volontaire peut se discuter sur le plan moral. Voir Y a-t-il une limite à la liberté de disposer de son propre corps ?), il n’en reste pas moins « pernicieux ». Il faut en effet faire un effort de raisonnement pour comprendre pleinement les implications de ces chiffres. Par ailleurs, cet effet de « probabilité inversée » se conjugue souvent avec un autre : le fameux « effet cigogne [18] » qui consiste à voir un rapport de cause à effet là où il y a une corrélation. Ainsi, lorsqu’un conducteur particulier ne met pas sa ceinture, il n’augmente pas forcément de manière radicale sa probabilité de mourir. En effet, ceux qui ne mettent pas leur ceinture font peut-être plus d’imprudences que ceux qui la mettent, font peut-être plus de route, sont moins vigilants, plus jeunes, plus âgés, que sais-je…
Une phrase comme « 30 % des consommateurs de drogues dures ont commencé par fumer du cannabis » (phrase inventée pour l’occasion, mais vous avez dû en rencontrer des semblables) a toutes les chances d’être interprétée comme « 30 % des fumeurs de cannabis vont prendre des drogues dures et cela, à cause de leur consommation de cannabis ». Maintenant que vous avez tout compris et que vous êtes sensibilisé(e) à l’effet de « probabilité inversée », vous pouvez vous amuser à les repérer et même à en inventer… N’hésitez pas à le coupler à l’effet cigogne pour obtenir de superbes phrases comme celles-ci pour manipuler les gens :
  • « 40 % des porteurs du VIH sont homosexuels » pour laisser penser : « Gare aux homosexuels, ils ont souvent le sida !»
  • « Aux États-Unis, 60 % des condamnés pour viol sont noirs » pour laisser penser : « Attention aux Noirs, ce sont des violeurs ! »
  • « 85 % des pédophiles consultent des sites web pornographiques » pour laisser penser : « Il est sur un site porno, tu te rends comptes, il est peut-être pédophile ! »
  • « 65 % des personnes qui payent l’impôt sur la fortune votent à droite » pour laisser penser : « Ceux qui votent à droite sont très riches »
  • « 70 % des élèves en échec scolaire regardent la télévision plus de 2h par jour » pour laisser penser : « Si mes enfants regardent trop la télévision, ils feront de mauvais élèves »
  • « 80 % des personnes atteintes d’une tumeur au cerveau possèdent un téléphone portable » pour laisser penser : « Les téléphones portables sont dangereux pour la santé ! »
  • « 40 % des chasseurs aiment écouter Robert Charlebois » pour laisser penser : « Tu dois être chasseur, je t’ai entendu siffloter du Robert Charlebois… Non ? Ah bon ! »
Florent Tournus

Notes

[1] Comme on peut le lire, références à l’appui, dans le livre « 100 petites expériences en psychologie du consommateur » de N. Guéguen (Éd. Dunod), au chapitre 1 intitulé « Les prix psychologiques », la terminaison « 9 » d’un prix possède une réelle influence sur le comportement d’achat.
[2] Vous me direz, ce n’est pas le but d’un message publicitaire !
[3] On l’écrit aussi parfois PB(A).
[4] Cette notion est au programme de mathématiques de terminale S, ES et L.
[5] Dans certains cas, les deux probabilités conditionnelles P(A/B) et P(B/A) se « ressemblent » et il faut vraiment réfléchir pour savoir quelle probabilité nous intéresse. Par exemple, dans le cas d’un test permettant de détecter une maladie, est-il préférable de connaître la probabilité que le test soit positif sachant qu’on est malade, ou celle qu’on soit malade sachant que le test est positif ?
[6] Ils meurent, mais quand ça ? Peu doivent se poser la question…
[7] En fait, même ce point n’est pas forcément clair. On peut en effet comprendre différemment le message de la sécurité routière : non pas « sur 5 morts d’un accident, 2 n’avaient pas mis leur ceinture » (ce qui revient effectivement à dire qu’il y a plus de morts « avec ceinture » que « sans ceinture ») mais : « sur 5 morts d’un accident, 2 sont morts à cause du fait qu’ils n’avaient pas mis leur ceinture, et 3 sont morts pour une autre raison ». Notons néanmoins que pour arriver à cette conclusion, il faudrait intégrer au raisonnement une analyse des causes réelles du décès, ce qui est très difficile (impossible ?). Cette ambiguïté du slogan est due à son caractère elliptique et à l’emploi des deux points : ils peuvent exprimer soit la concomitance des deux événements « ne pas avoir sa ceinture » et « être mort », soit un rapport de cause à effet. Et de fait, on peut tout à fait être mort et n’avoir pas mis sa ceinture, et imaginer que, d’après les circonstances de l’accident, on serait mort même si l’on avait mis sa ceinture… Pour la suite, nous considérons que le slogan indique bien uniquement une concomitance : « sur 5 morts d’un accident, 2 n’avaient pas mis leur ceinture ».
[8] On peut d’ailleurs lire ce raisonnement tenu par certains sur le net (certainement de façon humoristique…).
[9] Sauf si l’on suit le raisonnement erroné décrit ci-dessus.
[10] En toute rigueur, comme pour les sondages, on devrait indiquer des intervalles de confiance… mais ce n’est pas de cela que je voudrais parler ici.
[11] Au sens large, car rien n’indique dans le message que seuls les conducteurs sont concernés.
[12] C’est une forme du théorème de Bayes.
[13] Voir la note 7.
[14] Nous disposons d’une masse d’informations via une branche de recherche nommée « accidentologie » qui étudie les accidents et leurs causes. On peut consulter par exemple la section correspondante sur le site de la Sécurité routière.
On y trouve notamment un document intitulé « Les grandes données de l’accidentologie 2006 » qui nous donne cette information sur le port de la ceinture : « Si le port de la ceinture à l’avant était inférieur à 93 % sur les routes de rase campagne il y a dix ans, il atteint aujourd’hui plus de 98 %. En milieu urbain, la progression est spectaculaire, passant de 69,4 % en 1994 à 92,5 % aujourd’hui. Le taux de port de la ceinture aux places arrière est par contre beaucoup plus faible (74,2 % en milieu urbain) ».
Ce document rassemble par ailleurs un grand nombre de données présentant un effet de « probabilité inversée ». En voici quelques unes à titre d’exemple : « 79 % des motocyclistes tués ont entre 15 et 44 ans, et 52 % entre 20 et 34 ans » ; « 51,4 % des personnes tuées à cyclomoteur sont âgées de 15 à 19 ans » ; « 70 % des piétons tués le sont en ville » ; « 74 % des victimes sont des victimes locales : des piétons ou des occupants d’un véhicule immatriculé dans le département » ; « 11,8 % des accidents se sont produits par temps de pluie »… Telles quelles, ces données ne permettent pas de se faire une idée des différents facteurs de risque (mais il y a d’autres informations qui montrent de façon claire que certaines situations correspondent à un risque accru d’accident, comme par exemple « La nuit représente moins de 10 % du trafic mais 35 % des blessés hospitalisés et 44 % des personnes tuées »).
[15] Avec P(B) encore plus faible, le facteur multiplicatif serait encore plus grand.
[16] En fait, comme rappelé dans la note 14, nous disposons d’un grand nombre d’informations…
[17] Peut-être qu’il y a eu des études là-dessus…
[18] C’est le nom donné par Henri Broch à l’erreur qui consiste à confondre causalité et corrélation (voir p. 197 du livre « Le paranormal » d’Henri Broch, Éd. du Seuil).