Tu crois que ma vie va chahger ? Je ne sais pas… Faut voir les sondages…

Sondage : 63% des Français pour une limitation des libertés individuelles ! Et vous ?

Le 13 avril 2015, l’institut de sondage CSA publiait un sondage pour le site Atlantico.fr intitulé « Les Français et le projet de loi relatif au renseignement ». La plupart des médias des grands groupes de presse 1 relayèrent l’information avec pour titre « Loi renseignement : 63% des Français favorables à une limitation des libertés ». Au CORTECS, nous avons l’habitude d’être plutôt méfiants face aux sondages d’opinions tant l’art du sondage est délicat. Nous relayons donc ici une rapide analyse effectuée par l’équipe de Là-bas si j’y suis suivi d’un court et amusant reportage d’Anaëlle Verzaux et de Gaylord Van Wymeersch dans les rues de Paris et initialement publié ici.

Nous profitons de cet article pour relayer un appel au respect des libertés fondamentales et contre la nouvelle loi sur le renseignement car la pensée critique ne peut s’exercer sans liberté de critiquer et sans craindre d’être surveillé pour ces raisons. Lire la suite ici.

LOI SUR LE RENSEIGNEMENT, DES SONDAGES COUSUS DE FILS BLANCS

Le jeudi 30 avril 2015

Une loi liberticide, un « Patriot act » à la française, une surveillance de masse sans précédent… Non, la « loi pour le Renseignement » qui doit être votée le 5 mai ne fait pas vraiment l’unanimité. Pour comprendre, nous avons réuni cinq intervenants qui, chacun dans son domaine, condamnent cette loi sécuritaire, Justice, Police, Média, Syndicat, Internet : « Si t’as rien à te reprocher, t’as pas peur d’être surveillé ».

Pourtant, selon les médias, cette loi a le soutien de l’opinion. D’après un sondage de l’institut CSA de la mi-avril, 63% des Français y sont favorables. Le chiffre est repris partout. Un excellent argument pour le gouvernement face à ses contestataires : les Verts, la gauche, la droite, la droite extrême, les militants politiques et syndicaux, les défenseurs des Droits, y compris la CNIL…
Alors ?

Alors regardons d’un peu plus près ces sondages. C’est facile, ils sont publiés sur le site de l’Institut CSA :

Question : Avez-vous entendu parlé de ce projet de loi ?

Réponse 1 – Non, je n’en ai pas entendu parlé : 27 %
Réponse 2 – Oui, mais je ne vois pas de quoi il s’agit : 40%
Donc, total des personnes qui n’y comprennent rien : 67%

À quoi s’ajoutent 5% qui sont sans opinion : 5%

Soit au total, ignorants, indifférents, incompétents : 72% !

Restent les « Oui, je vois bien de quoi il s’agit » : 28%

Question : Combien parmi ceux là sont favorables à la loi ?

Réponse : On ne sait pas

Question : D’où vient l’affirmation « 63% des Français sont favorables à une limitation des libertés individuelles pour lutter contre le terrorisme » ?

Réponse : C’est un gros bobard.*

Pas besoin d’être un grand de l’investigation pour le débusquer. Abuser de la confiance, jouer sur les mots et sur les émotions avec autorité. Manipuler l’opinion est une vieille coutume.* Ça ne marche pas toujours, heureusement. La preuve ce reportage d’Anaëlle VERZAUX et de Gaylord VAN WYMEERSCH dans les rues de Paris : SOURIEZ VOUS ÊTES SURVEILLÉS (8’34)

* Note du CORTECS : pour être plus précis, on peut dire que cette information est trompeuse étant donné qu’affirmer la faveur d’une personne à « la limitation des libertés individuelles pour lutter contre le terrorisme », si cette même personne n’est pas informée des dispositions relatives à cette limitation, n’a tout simplement aucun sens et est dangereusement manipulatoire.)

alt

Mathématiques – Limiter l'influence de données chiffrées sur notre perception d'une situation

Nicolas Gauvrit nous le démontrait dans Graphiques, attention aux axes : plusieurs représentations graphiques distinctes peuvent être justes simultanément tout en provocant des perceptions très différentes de l’importance d’une variation ou d’une quantité. Le choix d’une représentation graphique peut donc influencer notre perception d’une situation donnée. Afin de limiter l’impact de cet effet sur notre jugement, il nous suffira de prendre une petite habitude peu coûteuse en temps : jeter un coup d’œil à l’échelle et à la valeur prise pour origine de l’axe des ordonnées. 
Mais il s’avère que, de manière tout à fait similaire, une simple présentation de données chiffrées, qui pourrait sembler totalement objective, peut tout autant influer sur notre ressenti. Dans ce TP tout spécialement dédicacé aux « mathophobes », j’illustrerai ce phénomène sur un article du Dauphiné libéré intitulé Arnaques aux prestations sociales – Ces fraudes qui nous coûtent très chères et proposerai une parade efficace : confronter valeurs absolues et valeurs relatives.


Valeurs absolues et valeurs relatives.

La valeur relative est importante
Commençons avec un exemple fictif et imaginons qu’on me dise :  » tu te rends compte, il y a 5 femmes dans cette entreprise ! « . Le ton de la phrase indique clairement qu’il y a là quelque chose de surprenant, mais hors contexte, si nous ne connaissons pas l’entreprise en question, on a bien du mal à savoir s’il faut s’étonner qu’il n’y ait que 5 femmes ou bien, au contraire, qu’il y ait autant de femmes. Dans cet exemple, mon interlocuteur me donne la valeur absolue du nombre de femmes. C’est une donnée en soi, probablement juste, mais qui ne me donne pas les informations nécessaires pour mesurer le côté  » extra-ordinaire  » de la situation.
S’il m’avait dit :  » tu te rends compte, dans cette entreprise, il y a 50 salariés et 5 femmes !  » ou bien  » tu te rends compte, il y a 5 salariés : ce sont 5 femmes ! « , j’aurais compris sa surprise, dans un sens ou dans l’autre. Cette nouvelle donnée me permet d’évaluer ce qu’on appelle la valeur relative du nombre de femmes, sous-entendu relativement au nombre de salariés : 10% dans le premier cas, 100% dans le second.
La valeur absolue est importante
Imaginons à présent que cette même personne me dise : « tu te rends compte, mon salaire n’a augmenté que de 0,5% alors que celui de ma collègue a augmenté de 3% ». On peut se dire à la vue des ces valeurs relatives que la situation est injuste. Mais avant de se faire un jugement, il est toujours bon d’aller chercher quelques renseignements supplémentaires : mon interlocuteur dit avoir un salaire net de 10 000 euros/mois et sa collègue déclare 1 000 euros/mois. Je peux alors calculer la valeur absolue de leur augmentation – ici c’est la valeur en euros : 500 euros par mois pour mon ami et 30 euros pour sa collègue. En valeur absolue, l’injustice apparaît dans l’autre sens.
Les valeurs relatives et absolues sont justes toutes les deux, mais provoquent un ressenti opposé.
On retiendra de ces deux exemples une chose fondamentale : valeur relative et valeur absolue sont aussi importantes l’une que l’autre pour se faire un avis et il faudrait pouvoir exiger systématiquement qu’on nous donne les deux, sous peine de laisser à la personne qui défend sa thèse la possibilité de jouer sur notre ressenti en choisissant la valeur qui va le plus dans son sens. 


Titre

alt
Titre + sous-titre

CorteX_fraude_rsa_Dauphine-libere_extrait_1
Extrait n°1

1er extrait + sous-titre : la fraude aux prestations sociales est estimée entre 8 et 10 milliards d’euros (valeur absolue).
Quel sentiment cela provoque-t-il ?
Pour établir la valeur relative, il nous manque la quantité de prestations sociales versées au total. L’article est long, mais en cherchant bien, on finit par trouver – si cette donnée n’avait pas été présente, on aurait pu aller la chercher dans le rapport de la Cour des comptes.

CorteX_fraude_rsa_Dauphine-libere_extrait_3
Extrait n°2
Valeur relative de la fraude par rapport à l’ensemble des prestations sociales : (8/450)*100 = 1,8%.
On pourra remplacer cette valeur relative dans le sous-titre et le premier extrait. Ressentez-vous la même chose ?


Un autre passage a attiré mon attention. Le voici.

CorteX_fraude_rsa_Dauphine-libere_extrait_2

Extrait n°3

Pourquoi m’arrêter sur ce passage ? Parce qu’à la première lecture, j’avais compris ceci :

Valeur (absolue) de la fraude détectée : 675 millions
Nombre d’allocataires contrôlés : 10 000

Difficile de se faire une idée de la situation avec ces chiffres « bruts », mais un rapide calcul de… valeur absolue démontre qu’il y a très probablement anguille sous roche :

Fraude moyenne par allocataire (ou valeur relative) : 675 000 000 / 10 000 = 67 500 euros/allocataire

L’ordre de grandeur est complètement déraisonnable, d’autant plus si l’on se souvient que le sous-titre nous assure que la plupart des fraudeurs sont des RMIstes. Des RMIstes qui arriveraient à frauder plus de 67 000 euros, c’est très étonnant. Un peu trop… Je suis donc allée vérifier à la source, dans le rapport des la Cour des comptes, et j’y ai trouvé ceci

 
Rapport de la Cour des comptes – Septembre 2009 – p????Les travaux les plus avancés d’analyse d’échantillons ont été menés dans la branche famille. La CNAF a réalisé en effet, au second semestre 2009, une évaluation des fraudes, à partir d’un échantillon représentatif de plus de 10 000 dossiers. Avec l’inévitable marge d’incertitude[…], les travaux réalisés semblent constituer une première base de travail solide qui permet de donner un ordre de grandeur de la fraude totale dans la branche famille, qui atteindrait environ 675 M€ par an […]

Ce petit mot, « totale », avait disparu dans l’article du Dauphiné Libéré. Il s’agit probablement d’une imprécision, mais toute influence n’est pas nécessairement « voulue » ou décidée. Il y a une différence de taille entre « on a repéré une fraude de 65 millions d’euros sur 10 000 allocataires » et « on a repéré une fraude de 65 millions d’euros sur l’ensemble des allocataires ».
Pour obtenir la valeur exacte de la fraude moyenne par allocataire, il nous faut le nombre total d’allocataires de la branche famille, nombre que je n’ai pas trouvé.
-> donc RSAste :  fraude 70% * 675000000= 472 Millions
nombre de RSAstes (2009) : 1,7 million
moyenne : 277 euros/an/allocataire -> erreurs ?


Repérer les probabilités inversées

Dans cet article, Florent Tournus nous avait fourni une explication claire et précise de ce que l’on appelle les probabilités inversées. Malgré tout, celles-ci restent difficiles à détecter dans un argumentaire ou une simple déclaration et, même avec de l’entraînement, nous devons souvent fournir un effort intellectuel pour décrypter et analyser les erreurs d’interprétations des probabilités inversées. Avec ces quelques exemples supplémentaires, nous pourrons trouver une aide précieuse en cas de cafouillage cérébral face à ces statistiques et autres probabilités. Aussi, n’hésitez pas et écrivez-nous pour partager vos exemples les plus éclairants.

Exercice – Saurez-vous détecter en quoi nous avons affaire à un effet de probabilités inversées sur cette affiche sortie tout droit d’un restaurant McDonald’s :

CorteX_Proba_inversee_Macdo

Si rien ne paraît suspect à première vue, un petit détour par deux autres exemples s’impose.

Des sous-vêtements dangereux ?

Tout d’abord, voici quelques mots sur les probabilités dites inversées. Comme l’explique très bien Florent dans son article, pour avoir une utilité, une probabilité, exprimée en pourcentage, doit être clairement définie. Si j’affirme par exemple que la probabilité de gagner au loto est de 0,000000052 soit 0.0000052%, je dois alors préciser que ce chiffre correspond à la probabilité de trouver 5 numéros parmi 49 + 1 numéro parmi 10. Même si tout le monde avait compris que l’on ne parlait pas de la chance de trouver seulement trois bons numéros, il est toujours nécessaire de fournir ces précisions : probabilité de quoi ?

Lorsqu’il s’agit d’évaluer le risque de contracter une maladie, en particulier le poids de facteurs environnementaux, les choses se compliquent. Prenons l’exemple d’une maladie comme le cancer des poumons. On peut lire que « le premier facteur de risque est le tabac » avec 81% des décès, en France (voir la page d’accueil du site Fondation Recherche Médicale). Que signifie cette probabilité ? Que 81% des personnes décédées d’un cancer des poumons fumaient du tabac (d’ailleurs rien n’est précisé sur les doses, le type de tabac, etc. mais ce n’est pas le problème qui nous intéresse ici). Autrement dit, la probabilité d’avoir consommé du tabac sachant qu’on est décédé d’un cancer des poumons est de 81%, CorteX_Slipet d’en déduire que la cause principale de ces cancers est le tabagisme. Attention, si vous en tirez cette conclusion, vous êtes en train de toucher du doigt le problème des probabilités inversées : ce n’est pas cette statistique seule qui permet d’inférer un lien de cause à effet entre tabagisme et cancer. Car on pourrait très bien trouver, en cherchant un peu, que 99% des personnes décédées portaient des sous-vêtements, sans pour autant en conclure à un lien causal direct entre porter un slip et mourir d’un cancer des poumons. Autrement dit, la probabilité de porter des sous-vêtements sachant que l’on est mort d’un cancer ne nous donne aucune information sur la dangerosité ou le risque de cette pratique.

Où se niche l’erreur subtile de raisonnement ? Dans le fait que la probabilité qu’on nous donne n’est pas la probabilité qui nous intéresse, même si elle lui ressemble à s’y méprendre. Ce qui nous intéresse n’est pas la probabilité d’avoir porté une culotte, d’avoir fumé ou de s’être curé le nez sachant qu’un cancer nous a fait passer de vie à trépas. Non, nous voulons savoir l’inverse : la probabilité de mourir d’un cancer sachant qu’on se gratte le nez.

Travailler chez McDo avec « des perspectives d’évolution rapide »

Reprenons le texte de l’affiche. En grand, on peut lire : « Plus de 70% de nos managers et directeurs adjoints ont débuté comme équipiers* ». L’enquête a été réalisée par un institut de sondage (Ipsos 2012, publiée par McDonald’s). Si l’affirmation est vraie, il nous faut nous méfier de la conclusion que nous allons en tirer. Effectivement, il est impossible d’en déduire que de nombreux équipiers deviendront managers un jour, ce que suggère pourtant la phrase « Chez McDonald’s, un emploi permet des perspectives d’évolution rapide. » Traduisons cette phrase dans les mêmes termes que pour l’exemple du cancer : nous savons à présent que la probabilité d’avoir été équipier sachant qu’on est manager est égale à 70% ou plus. Est-ce bien l’information dont nous avons besoin pour connaître les chances d’évolution dans le métier ?

Comme pour les risques sur les maladies, il nous est impossible de conclure à une évolution de poste grâce à cette seule statistique. Souvenons-nous en effet que la probabilité qui nous intéresse est celle donnant les chances d’accéder à un poste de manager sachant que l’on est équipier (et qu’on en fait la demande ou qu’on le désire). Or nous savons simplement l’inverse : la probabilité d’avoir été équipier sachant qu’on est manager, et celle-ci ne sert à rien quant aux possibilités d’évolution de carrière.

Un doute persiste : il se pourrait que cette statistique signifie vraiment quelque chose. Par exemple, que 70% des postes de managers sont réservés à des travailleurs internes à l’entreprise. Ceci est tout à fait exact : on peut devenir manager en étant équipier, la voie n’est pas fermée. Ce qui est fallacieux avec la publicité de cette affiche est de laisser croire à un lien de cause à effet entre ce pourcentage et l’affirmation que « Chez MacDonald’s, un emploi permet des perspectives d’évolution rapide » : l’un n’implique pas l’autre. Avec un calcul rapide à partir des chiffres donnés par MacDonald’s (site officiel, MacDonald’s France) on peut estimer le nombre d’équipiers et de managers. Ce faisant, nous avons trouvé une statistique encore plus intéressante : « 80% des directeurs** ont commencé leur carrière comme équipier ». Utilsons-là pour calculer le ratio directeurs/équipiers. Nous apprenons qu’en moyenne 54 personnes travaillent dans un restaurant, donc 53 ne sont pas directeurs. D’après une de nos sources internes, on peut estimer à 90% la part des équipiers dans le personnel (les cuisiniers sont des équipiers), c’est-à-dire 47 travailleurs environ, nous obtenons un ratio directeurs/équipiers = 1/47 = 0,021 soit 2,1%. Sachant que les managers peuvent être plus d’un par restaurant, le ratio est certainement plus élevé pour ceux-ci. Mais en admettant qu’on atteigne en moyenne le double, cela représente un ratio de 4%. La voie n’est donc pas fermée, mais elle reste très étroite.

Denis Caroti

Note : un autre exemple de probabilités inversées nous est donné par G. Reviron avec les propos d’Eric Zemmour sur la délinquance. De même, on pourra consulter les articles de R.Monvoisin sur le problème du Monty Hall, et de Nima Yeganefar sur la propagande.

———————–

* Impossible de ne pas réagir à ce qualificatif. « Équipier », superbe mot à effet impact et qui enjolive ce qui n’est en réalité qu’un emploi souvent mal payé car à temps-partiel, pour des étudiants précaires qui doivent financer le coût exorbitant de certains cursus et le loyer d’une chambre hors de prix dans une agglomération où l’inflation des loyers oblige à vivre loin de leur faculté, augmentant de fait le temps passé dans les transports. Équipier sonne alors comme la gloire du travail partagé, de l’investissement pour une oeuvre supérieure qui nous dépasse mais pour laquelle nous donnons tout notre possible… Ce sont avant tout des travailleurs sous-payés.

** Les directeurs sont les supérieurs hiérarchiques des managers, il y en a un seul par restaurant, assisté par un directeur adjoint. On pourra consulter l’organigramme sur le site officiel de MacDonald’s.

Chaîne de Ponzi, affaire Maddoff et retraites

Si quelqu’un vous vend un tableau mille euros, en vous assurant qu’il le revendra le lendemain 2000 euros, mais ne revient pas ledit lendemain : avez-vous perdu 1000 euros ? Ou avez-vous perdu 2000 euros ? Combien vaut une promesse de 1000 euros ?
Voici un travail pratique qui n’a pas encore été développé en cours par l’un.e d’entre nous, mais qui mériterait d’être testé car il fait le pont entre un escroc de Boston, des systèmes économiques pyramidaux et un débat moral captivant pouvant déborder, comme le fait Delahaye ci-contre, sur le système français des retraites.


Imaginons que quelqu’un propose un investissement à 100 % d’intérêts : vous lui donnez 10 euros, il vous en rend 20 en utilisant l’argent déposé par les clients suivants (il lui suffit d’ailleurs de proposer un rendement double des rendements connus du marché pour s’attirer de la clientèle et pour durer). Le système est viable tant que la clientèle afflue, attirée en masse par les promesses financières (et d’autant plus tentantes que les premiers investisseurs sont satisfaits et font une formidable publicité au placement). Les premiers clients, trop heureux de ce placement mirifique, reviennent dans la chaîne eux aussi, s’ajoutant à tous ceux qu’ils ont réussi à convaincre.

Le phénomène fait alors boule de neige, entretenu tant que l’argent rentre et permet de payer à 100 % les nouveaux investisseurs. L’organisateur prend une commission, bien compréhensible lorsque l’on voit les promesses qu’il fait, et qu’il tient. La chaîne peut durer tant que la demande suit la croissance exponentielle imposée par ce système, les clients arrivant par 2, 4, 8, 16, 32, etc. Lorsque la chaîne se coupe, la bulle éclate : tous les derniers investisseurs sont spoliés. Les gagnants sont ceux qui ont quitté le navire à temps et, surtout, l’organisateur.

Un système de Ponzi (« Ponzi scheme » en anglais) est un montage financier frauduleux qui consiste à rémunérer les investissements des clients essentiellement par les fonds procurés par les nouveaux entrants. Si l’escroquerie n’est pas découverte, elle apparaît au grand jour et s’écroule quand les sommes procurées par les nouveaux entrants ne suffisent plus à couvrir les rémunérations des clients1. Elle tient son nom de « Charles » Ponzi qui est devenu célèbre après avoir mis en place une opération basée sur ce principe à Boston dans les années 1920, même si le principe est bien plus vieux. Il est d’ailleurs narré dans une nouvelle de Charles Dickens de 1843 intitulée Vie et aventures de Martin Chuzzlewit.

Le mathématicien Marc Artzrouni modélise les chaînes de Ponzi en utilisant des équations différentielles linéaires du premier ordre.

Soit un fonds avec un dépôt initial K/>0″> au temps <img src=, un flux de capitaux entrant de s(t), un taux de rendement promis r_p et un taux de rendement effectif r_n. Si r_ngeq r_p alors le fonds est légal et possède un taux de profit de r_n-r_p. Si par contre r_n< r_p, alors le fonds promet plus d’argent qu’il ne peut en obtenir. Dans ce cas, r_p est appelé le taux de Ponzi.

Il faut aussi modéliser les retraits faits par les investisseurs. Pour ce faire, nous définissons un taux de retrait constant r_w, appliqué à tout temps t sur le capital accumulé promis. Le retrait au temps t vaut donc r_wKe^{(r_p-r_w)t}. Il faut aussi ajouter les retraits des investisseurs qui sont arrivés entre le temps 0 et le temps t, à savoir ceux qui ont investit s(u) au temps u. Le retrait pour ces investisseurs est donc de r_ws(u)e^{(r_p-r_w)(t-u)}. En intégrant ces retraits entre 0 et t et en ajoutant les retraits des investisseurs initiaux, nous obtenons: W(t)=r_w(Ke^{(r_p-r_w)t}+int_0^ts(u)e^{(r_p-r_w)(t-u)}du)

Si S(t) est la valeur du fonds au temps t, alors S(t+dt) est obtenu en ajoutant à S(t) l’intérêt nominal r_nS(t+dt), le flux de capitaux entrant s(t)dt et en soustrayant les retraits W(t)dt. Nous obtenons donc S(t+dt)=S(t)+(r_nS(t)+s(t)-W(t))dt, ce qui conduit à l’équation différentielle linéaire dS(t)/dt=r_nS(t)+s(t)-W(t)

    Voici un extrait de l’émission du 17 septembre 2012 de Continent Sciences, sur France Culture, avec Jean-Paul Delahaye, qui pose très bien la question suivante : dans quelle mesure le système de retraites françaises est-il une chaîne de Ponzi ?

Télécharger ou écouter :

Nonobstant deux imprécisions de Jean-Paul Delahaye :

– il confond Charles Dickens et Edgar Allan Poe dans ce passage

– il ne cite pas l’association philanthropique ayant déposé de l’argent chez B. Madoff. Et pour cause, il y en a plusieurs : les Fondations Carl et Ruth Shapiro, Jeffry et Barbara Picower, Sonja Kohn, The Mark and Stephanie Madoff Foundation, the Deborah and Andrew Madoff Foundation, America Israel Cultural Foundation, The American Committee for Shaare Zedek Medical Center, Hadassah, l’organisation des femmes sionistes et United Congregations Mesorah, une association religieuse qui est poursuivie pour 16 millions de dollars.

Mathématiques – Comment tromper avec des graphiques

Un graphique a généralement pour but d’illustrer un propos souvent trop complexe pour le lecteur ou le téléspectateur, et qui gagnerait en clarté en étant présenté de manière synthétique. Cette version « visuelle » est donc régulièrement choisie pour exposer des données de façon immédiate et avec le moins d’ambiguïté, que ce soit pour faire comprendre rapidement l’évolution du chômage, les résultats extraordinaires d’un dentifrice sur l’acidité de notre bouche ou la diminution de la dette du Lesotho.
Mais cette présentation ne va pas toujours de soi : les choix des axes, des origines, de la présentation, des données illustrées peuvent tout aussi bien tromper qu’éclairer et faire passer une augmentation significative pour stagnation évidente, une homogénéité de fait pour disparité flagrante, etc.
Si de très bons ouvrages existent et présentent quelques-uns de ces pièges (voir ci-dessous), voici quelques exemples à consulter directement.
N’hésitez pas à nous faire connaître les vôtres –> contact(at)cortecs.org
Denis Caroti

 
 

Graphiques, attention aux axes

Nicolas Gauvrit nous offre ici du matériel pédagogique « prêt-à-l’emploi » permettant de déconstruire quelques artifices graphiques, notamment sur le choix des axes.

[dailymotion id=xgylu8]

Pour voir les autres ressources pédagogiques de Nicolas Gauvrit, cliquez ici. 

Chiffres de la délinquance

Note de Guillemette Reviron : lorsque j’ai présenté le travail de Nicolas Gauvrit (ci-dessus) à un public de travailleurs sociaux, un membre de l’assemblée (merci à lui) m’a signalé cette séquence du Journal Télévisé de 20h (le 20 janvier 2011 sur TF1) : Brice Hortefeux, ministre de l’Intérieur à l’époque, venait présenter l’évolution des chiffres de la délinquance et avait préparé pour cela un beau graphique.

 

Après avoir vu la vidéo de Nicolas Gauvrit, cela saute aux yeux : il manque l’axe vertical, celui qui contient toute l’information, sans parler du titre, particulièrement vague. Le graphique du ministre ne veut tout simplement rien dire.

Cet extrait peut être utilisé de la manière suivante :
a. On peut commencer par projeter l’extrait du Journal Télévisé…
b. puis on montre la vidéo du cours de Nicolas Gauvrit…
c. Et enfin, nouvelle projection de l’extrait et analyse. 

Chiffres du chômage

Voici une autre illustration de l’impact que peut avoir le choix d’une échelle sur un graphique, tiré du Petit Journal du 29 novembre 2011 (Canal +). Merci à Frantz Diguelman de me l’avoir signalé.

Les graphiques :

CorteX_Chiffres_chomage_comparaison_graphique_Le_Petit_journal_29_11_2011_Image1CorteX_Chiffre_chomage_comparaison_graphique_Le_Petit_journal_29_11_2011_image2CorteX_Chiffre_chomage_comparaison_graphique_Le_Petit_journal_29_11_2011_image3
Journal Télévisé – 20h – TF1Journal Télévisé – 20h – France 2Journal Télévisé – 20h – France 2

Guillemette Reviron

Résultats scolaires : graphiques, méfions-nous(1) !

Comme chacun le sait, les diagrammes en « toile d’araignée » permettent, bien mieux qu’un histogramme ou un simple tableau, de repérer rapidement le « profil » des notes d’un élève lors d’un conseil de classe…

Lire la suite

Alain Le Métayer

(1) Ce titre est bien sûr un clin d’œil à Nicolas Gauvrit, l’auteur de Statistiques. Méfiez-vous ! Ellipses, 2007.

Bibliographie

Trois ouvrages au moins nous ont convaincu de leur utilité pour tenter de déjouer les artifices qui peuvent être créés (volontairement ou non) à l’aide de ces « outils graphiques » :

  • Statistiques. Méfiez-vous ! Nicolas Gauvrit, Ellipses, 2007.
  • Petit cours d’autodéfense intellectuelle, Normand Baillargeon, Lux, 2006.
  • Déchiffrer le monde : contre-manuel des statistiques pour citoyens militants, Nico Hirtt, Aden Editions, 2007.

Solution – Le jeu des trois boîtes, ou problème de Monty Hall

Voici la solution au jeu des trois boîtes, ou problème de Monty Hall, donnée par Louis Dubé, et complétée par le CorteX.
Pour revenir à l’énoncé, voir ici.

Voici différentes approches de la version initiale

Explication de Louis Dubé

La bonne réponse est la 2 : je change mon premier choix

La meilleure stratégie est de TOUJOURS changer son premier choix. En conservant votre premier choix, vousCorteX_Choix_Monty_Hall ne changez pas de probabilité de succès, qui demeure un tiers. En changeant toujours de choix, vos chances de succès sont deux fois plus grandes. Car, en dévoilant l’une des boîtes qui n’a pas d’argent sous elle, le maître de cérémonie vous offre effectivement l’ensemble des deux choix qui restent, dont la probabilité égale deux tiers. La figure ci-contre illustre ce concept.

L’illusion est de penser que s’il reste deux choix et qu’on ignore lequel, notre premier choix est aussi bon que le deuxième offert (soit 50 %).

Tentez vous-mêmes l’expérience : un joueur cache l’argent sous l’une des trois boîtes à l’insu d’un deuxième joueur; le deuxième joueur tente de deviner où le premier joueur a caché l’argent en utilisant systématiquement – pendant disons 30 coups – l’une ou l’autre des stratégies proposées. Vous obtiendrez environ 20 succès sur 30, en suivant la stratégie de toujours changer de choix ; deux fois mieux que si vous gardiez toujours votre premier choix.

Une autre façon de saisir l’importance de changer son premier choix est de considérer un problème similaire : au lieu de trois boîtes, supposons que le choix original vous propose un millier de boîtes, dont une seule contient l’argent convoité. Vous choisissez au hasard la boîte N°527. Pour vous aider, le maître de cérémonie dévoile 998 boîtes qui ne contiennent pas d’argent, seule la boîte N°721 demeure, ainsi que votre choix original : la boîte N°527. Garderiez-vous votre choix original qui n’avait qu’une chance sur mille de contenir l’argent ? Croyez-vous vraiment que votre premier choix aurait maintenant une probabilité de 50 % ? Il apparaît évident que vous changeriez de choix en croyant (justement) qu’il y a beaucoup plus de chances (999 chances sur 1000) que l’argent se trouve sous la seule boîte (autre que votre choix original) qui n’a pas été dévoilée.

 Louis Dubé

Approche expérimentale

Louis Dubé suggère à tout élève de collège de rendre fous ses professeurs en leur faisant une simple démonstration sur 30 essais. Personnellement, je vais essayer de le faire aux étudiants de zététique avec des gobelets, un euro et deux chewing gum mâchés (je viendrai raconter l’expérience).

Explication de Guillemette Reviron

CorteX_Guillemette

À l’issue du premier tirage, la probabilité que je sois tombée sur la bonne boîte est de 1/3 et la probabilité que je me sois trompée, c’est-à-dire que la bonne boîte soit une des deux autres, est de 2/3. L’animateur ouvre ensuite une boîte vide. Cette petite manipulation ne change pas ces probabilités puisque le choix de la boîte a été fait avant :

– la probabilité d’être tombée sur la bonne boîte vaut toujours 1/3
– la probabilité que ce ne soit pas la bonne vaut toujours 2/3.

Ce qui a changé, c’est qu’à la première étape, si je me suis trompée, l’argent est sous l’une des deux autres boîtes alors qu’à présent, si je me suis trompée, l’argent est sous la seule autre boîte. J’avais 2 chances sur 3 qu’elle soit sous une des autres boîte, j’ai deux chances sur trois qu’elle soit sous l’autre boite.

Le tour est joué !

Regardez, j’ai parié, et j’ai gagné deux bouteilles de vin.

Explication grâce à l’arbre des possibles

Voici les versions (en anglais) de la version des tasses et (en français) de celle voiture/chèvres.

CorteX_tasses_Monty_HallCorteX_Arbre_des_possibilites_Monty_Hall

Démonstration à l’aide du théorème de Bayes

Pour des étudiants d’un certain niveau en mathématiques, on pourra résoudre le « paradoxe » avec le théorème du révérend Bayes, qui nous dit :CorteX_Thomas_Bayes

Soit un événement quelconque, et soit (Bi)i=1..n un ensemble d’événements à la fois exhaustifs et mutuellement exclusifs. Alors pour tout i, on a :

P(B_i|A) = frac{P(A | B_i) P(B_i)}{sum_{j = 1}^n P(A|B_j)P(B_j)}, ,

Supposons que je choisisse la boite n°3 – le raisonnement serait identique dans les deux autres cas – et notons :

– F1 (respectivement F2 et F3) : la voiture se trouve dans la boite n°1 (resp. 2 et 3)

– O1 (respectivement O2 et O3): l’animateur ouvre la boite vide n°1 (resp. 2 et 3)

Supposons alors que l’animateur ouvre la boite 1 – le raisonnement est le même s’il ouvre la boite 2.

La probabilité de gagner en changeant mon choix est alors la probabilité que la voiture soit dans la boite 2 sachant que l’animateur a ouvert la boite n°1, c’est-à-dire P(F2/01). Or, d’après la formule de Bayes.
 

 P(F2|O1) = frac{P(O1|F2) P(F2)}{sum_{i=1}^{3} P(O1|Fi) P(Fi)}  = frac{1 times frac{1}{3}}{0 times frac{1}{3} + 1 times frac{1}{3} + frac{1}{2} times frac{1}{3}}  = frac{2}{3}


En effet, si la voiture est dans la boite 2 et que j’ai choisi la boite 3 au premier tirage, la seule boite que peut ouvrir l’animateur est la boite n°1 donc P(01/F2) = 1.
De la même manière, si la voiture est dans la boite 1, l’animateur ne peut pas l’ouvrir donc P(O1/F1)=0 et si la voiture est dans la boite 3, l’animateur a deux choix équiprobables (la boite 1 ou la boite 2) donc P(O1/F3) = 1/2.

Pour aller plus loin

  • On retrouvera également une simulation avec chèvres et voiture sur le site du Laboratoire de Mathématiques Raphaël Salem de l’Université de Rouen (ici).
  • Pour les fans de l’utilisation des sciences dans les fictions, voici un extrait de Las Vegas 21, de Robert Luketic (2008) lors duquel l’enseignant (Kevin Spacey) pose la question à ses étudiants – dont le jeune héros (Jim Sturgess) qui répond bien (extrait en anglais – je cherche une version originale sous-titrée, en attendant contentons-nous du doublage français)

[youtube=http://www.youtube.com/watch?v=huLoJcTppXk]

  • Pour l’histoire, il semble que la paternité de ce dilemme revienne à Joseph Bertrand (ci-contre) en 1889, sous le nom de « Paradoxe de la boîte de Bertrand ». CorteX_Joseph_BertrandPuis c’est le regretté Martin Gardner, incontournable pionnier de la pensée critique décédé en 2010, qui l’exhuma en 1959 dans sa rubrique Mathematical Games du Scientific American sous le nom de « problème des trois prisonniers » (« Mathematical Games » column, Scientific American, October 1959, pp. 180–182). Enfin, c’est Steve Selvin qui rouvrit la question dans « A problem in probability (letter to the editor)« , American Statistician 29 (1): 67 (February 1975) et « On the Monty Hall problem (letter to the editor) », American Statistician 29 (3): 134 (August 1975).
  • Un site est entièrement consacré au problème, ainsi qu’un livre : Jason Rosenhouse, The Monty Hall problem – The Remarkable Story of Math’s Most Contentious Brain Teaser (Oxford University Press 2009).

 

  • CorteX_Louis_DubeLouis Dubé nous offre en prime un court programme commenté en langage Basic qui simule ce problème avec « N » boîtes (donc aussi avec 3 boîtes).

Voici :

  1. le code du programme avec commentaires.
  2. Le code source en fichier texte (qui peut facilement être copié)
  3. Les résultats pour 9 essais (chaque étape en détail pour bien saisir le processus) et les résultats cumulatifs pour 9 essais et pour 1000 essais.
Richard Monvoisin
Merci à Louis Dubé & Guillemette Reviron
 

Le jeu des trois boîtes, ou problème de Monty Hall

Connaissez-vous Monty Hall ? C’est le nom d’un présentateur télé états-unien qui a présenté pendant près de treize ans le redoutable jeu Let’s make a deal mettant en scène un casse-tête probabiliste tout à fait contre-intuitif, et par là même, stimulant la pensée critique. Ce « faux paradoxe » dont la première forme connue a plus d’un siècle est également connu sous le nom du « jeu des deux chèvres et de la voiture ».
Une première version de ce casse-tête nous a été envoyée par Louis Dubé, des Sceptiques du Québec. Suite à sa publication sur cette page, un enseignant de mathématiques en classe préparatoire, Judicael Courant, nous a soumis une version pleine de variantes, ludique, élaborée à quatre mains avec son collègue Walter Appel, qui ne postule plus la bienveillance de l’animateur. De quoi faire chauffer nos neurones.


Version initiale 

CorteX_Monty-Hall

  • 100 $ sont cachés sous l’une de trois boîtes, identifiées : A, B et C.
  • On vous demande de choisir sous laquelle des trois boîtes se trouve l’argent.
  • Ignorant sous laquelle des boîtes se trouve l’argent, vous choisissez au hasard la boîte A.
  • Pour vous aider, on dévoile qu’il n’y a pas d’argent sous la boîte B.

QUESTION : Conservez-vous votre choix : A ?

1. Oui, je garde mon premier choix
2. Non, je change mon premier choix
3. Aucune importance (soit toujours garder, soit toujours changer)
4. Au hasard (l’un ou l’autre à « pile ou face » à chaque coup)

Pour la solution , cliquez sur ce lien : Louis Dubé, des Sceptiques du Québec, le partage avec nous sous une forme simple ; les plus férus de mathématiques pourront le résoudre avec le théorème de Bayes.

 

Variantes

Nous relayons ici les remarques de Judicael Courant sur le jeu des trois boîtes, envoyées au Cortecs en décembre 2014, ainsi qu’une version complètement démoniaque de ce  casse-tête.

Bonjour,
Enseignant de mathématiques et d’informatique en classe prépas, […] je suis cependant déçu par votre page sur le problème des trois boîtes car vous faites l’impasse sur une question qui me semble essentielle pour la résolution du problème : est-on sûr que, lorsqu’on nous dévoile qu’il n’y a pas d’argent sous la boîte B, c’est bien pour nous aider ?
Si on a des raisons d’en douter, la solution peut devenir très différente : par exemple dans le cas extrême ou celui qui a caché l’argent a un côté pervers, on peut penser qu’il ne nous propose de modifier notre choix que parce nous avons trouvé la bonne boîte. On pourrait aussi se demander si, lorsque nous avons choisi la bonne boîte, la personne qui nous aide choisit de façon équiprobable entre les deux boîtes restantes, ou si elle a une préférence (par exemple, elle prend la première dans l’ordre alphabétique).
Je soumets à votre sagacité l’exercice ci-joint que j’ai donné à mes étudiants de MPSI l’an dernier. C’est un énoncé repris sur un collègue, Walter Appel, que j’ai volontairement rendu un peu plus complexe […]. Il me semble en effet qu’il y a un point important à débusquer derrière les études de ce genre : elles partent d’hypothèses a priori, très souvent implicites et non remises en question.

Version initiale

En 1761, Thomas Bayes, théologien protestant, quitte pour toujours cette vallée de larmes. Il arrive aux portes du Paradis et, comme il n’y a plus beaucoup de places et que Bayes a parfois eu des opinions assez peu orthodoxes en manière de théologie, Saint Pierre lui propose le test suivant. T. Bayes est placé devant trois portes identiques, dont deux mènent à l’enfer et une au paradis, et il est sommé de choisir. N’ayant aucune information a priori, Bayes choisit une des portes au hasard. Avant qu’il ait le temps de l’ouvrir, Saint Pierre — qui est bon — lui dit : « Attends, je te donne encore un renseignement… » et lui ouvre une des deux autres portes (menant bien entendu à l’enfer). Que doit faire Bayes ? Garder sa porte, ou changer d’avis et prendre l’autre porte non ouverte ?

Variante 1

Reprendre l’exercice dans le cas où Saint Pierre a passé la soirée précédente à faire la fête, il ne sait plus du tout où mènent les portes et en ouvre une au hasard et se rend compte qu’elle mène à l’enfer.

Variante 2

Vous arrivez vous-même devant Saint Pierre mais vous remarquez qu’il a un pied de bouc : Saint Pierre a tellement fait la fête qu’il n’est plus en mesure de s’occuper des entrées et Satan en a profité pour le remplacer (en se déguisant). Vous imaginez assez vite ce que fait Satan : lorsqu’un candidat a choisi une porte,

  • si elle conduit vers l’enfer, il le laisse prendre la porte choisie 
  • si elle conduit vers le paradis, il lui montre une porte conduisant vers l’enfer et lui propose de changer.

Vous choisissez une porte, Satan vous propose de changer. Que devez-vous faire?

Variante 3

En fait, vous réalisez que Satan est bien plus pervers que cela:

  • si le candidat choisit une porte conduisant vers l’enfer, il lui propose quand même de changer avec la probabilité p1
  • si le candidat choisit la porte conduisant vers le paradis, il lui propose de changer avec la probabilité p2.

Que devez-vous faire?

Atelier Esprit critique & Travail – la Fabrique du futur

J’ai co-animé avec notre compère Philippe Rennard un atelier sur le sujet du travail dans le cadre du cycle de coformation de la Fabrique du futur, à Grenoble. Voici le déroulé de cet atelier et le matériel utilisé pour aborder des notions d’esprit critique dans le vaste domaine du travail, que ce soit dans la présentation de chiffres ou de graphiques ou dans les discours politiques.


Cet atelier avait pour objectif de décortiquer des discours politiques et médiatiques autour du monde du travail afin de mettre en lumière des techniques de manipulations langagières, de raisonnements fallacieux, et l’utilisation abusive de chiffres et de données scientifiques.

Après le décorticage d’exemples, le groupe était ensuite invité à échanger sur les enjeux et les implications de ces petites et grandes manipulations.

1ère étape : un peu d’outillage critique

Avant de partir sur le terrain il est nécessaire de s’équiper.CorteX_Chiffre_chomage_comparaison_graphique_Le_Petit_journal_29_11_2011_image2 J’ai donc présenté une partie des techniques de manipulation des chiffres, de leur présentation fallacieuse et des moyens de s’en prémunir en utilisant essentiellement du matériel tiré de l’article de Nicolas Gauvrit et du matériel de Guillemette Reviron : Mathématiques et statistiques – Graphiques, attention aux axes ! .
Cet outillage est important car il permet de tordre le cou à l’idée d’une objectivité totale dans la présentation de résultats scientifiques, qui bloque le débat et empêche toute contestation sous le prétexte que « c’est arithmétique ! on ne peut donc rien y faire ». Comme le dit Franck Lepage « On ne va pas descendre dans la rue en disant : non à l’arithmétique, non à l’arithmétique ! ».
Comprenons bien que si les données de bases sont objectives, la manière dont on en rend compte ne l’est pas forcément.

2ème étape : utilisation de données scientifiques

Des chiffres du chômage jusqu’aux sondages d’opinion, les discours politiques et médiatiques à propos du travail sont régulièrement étayés par des données de type scientifique. Pourtant ces données apparemment objectives peuvent être largement dévoyées, que ce soit pour mieux coller à la ligne éditoriale d’un journal, à celle d’un courant politique. J’ai présenté deux exemples.

1er exemple : le Journal du dimanche du 12 octobre 2008 affiche en couverture « Sondage : les Français veulent travailler le dimanche. »

L’article s’appuie sur un sondage Ifop-Publicis et indique que 67% des français veulent travailler le dimanche. Pourtant, quand on prend le temps d’éplucher ledit sondage, on se rend compte que la question était posée d’une bien curieuse façon.
Question : « travailler le dimanche est payé davantage qu’en semaine. Si votre employeur vous proposait de travailler le dimanche, accepteriez-vous ? ».
CorteX_travai_Titre choc2Réponses possibles :
– non jamais (33%)
– de temps en temps  (50 %)
– toujours  (17 %)
 
On note que la question n’est pas « voulez-vous travailler le dimanche ? » ou « êtes-vous favorable au travail le dimanche ? » comme le titre de l’article semble l’affirmer.
La question est construite d’abord sur une prémisse (travailler le dimanche est payé davantage qu’en semaine) puis une hypothèse (si votre employeur vous proposait de travailler le dimanche, accepteriez-vous ?). Cette construction oriente particulièrement les réponses des sondés, qui n’ont que le choix d’accepter la prémisse de départ qui ne va pourtant pas de soi (travailler le dimanche n’est pas forcement payé plus) et qui se centre sur l’aspect pécuniaire.
Enfin, les réponses possibles sont restreintes : – non jamais – de temps en temps  – toujours. La proposition de réponse à 3 entrées induit presque automatiquement un effet Bof en offrant une réponse moyenne, consensuelle : « de temps en temps », ce qui expliquerait peut-être les 50% pour cette réponse.
Les 3 entrées offrent, en outre, la possibilité de présenter les résultats à la guise du commentateur : « Travail le dimanche : 67% des français y seraient favorables », c’est-à-dire, 50 % « de temps en temps » + 17 % « toujours ».  Mais on pourrait commenter également : « Travail le dimanche : 83 % des français n’y seraient pas vraiment favorable » : c’est-à-dire 50 % « de temps en temps » + 33% « non jamais ».
Cette présentation joue sur un effet Bi-standard, qui consiste à raisonner selon deux standards différents selon les circonstances, en gros changer les règles en cours du jeu.
Article lié, sur Agoravox

2ème exemple : Le Figaro.fr du 12 Octobre 2010 titre « Partir plus tôt en retraite peut nuire à la santé »

CorteX_travai_Le figaro_travail et sante« Partir plus tôt en retraite ne permet pas forcément aux ouvriers d’en profiter plus longtemps. Au contraire, un rapport publié par l’Institut allemand pour l’étude du travail, montre que cela augmente les chances de mourir prématurément », annonce l’article du Figaro en octobre 2010, étude scientifique à la clé.
Fatal Attraction ? Access to Early Retirement and Mortality”, Andreas Kuhn Jean-Philippe Wuellrich, Josef Zweimüller, Institute for the Study of Labor, August 2010.

Là encore, la lecture de l’étude nous apprend beaucoup de choses, entre autres ces conclusions des chercheurs  : « Pour les hommes, partir à la retraite un an plus tôt augmente de 13,4% les chances de mourir avant 67 ans. Pour les femmes, en revanche, un départ à la retraite anticipé n’a aucun effet sur l’âge du décès » est interprété par le Figaro comme « Partir plus tôt en retraite peut nuire à la santé » C’est une simplification pour le moins radicale.

Ensuite l’article du Figaro ne mentionne pas une donnée importante. En effet, les chercheurs parlent de retraites volontaires et de retraites non volontaires (licenciements par exemple) : « La retraite précoce concernant les départs volontaires ne semble pas liée à la mortalité, alors que la retraite précoce causée par des licenciements involontaires l’est ». Cela change la conclusion de cette étude par rapport à la présentation qu’en fait l’article.

Enfin, l’article du Figaro ne mentionne pas les hypothèses d’explication des chercheurs, conclusion de l’étude : « Finalement, nous apportons des éléments prouvant que la retraite précoce involontaire a un effet négatif sur la santé, mais pas nécessairement la retraite précoce volontaire »

Ce sont bien les départs en retraite « involontaires » qui auraient un impact significatif sur la mortalité, et non le fait – en lui-même – de partir à la retraite plus jeune. Nous avons donc affaire à un effet Cigogne.
On peut se demander si l’article du Figaro n’a pas été construit d’abord sur une conception idéologique – qui serait : « partir en retraite plus tôt n’est pas forcément une bonne chose » – puis étayé ensuite par les données de l’étude scientifique, non sans de petits oublis et de grandes simplifications. Cela s’apparente à un effet petit ruisseaux : si les petits ruisseaux font les grandes rivières, les petits oublis (ou erreurs) permettent les grandioses théories. Pour éviter cet effet, on peut se poser la question suivante : tous les paramètres sont-ils donnés et donnés correctement ?

Article lié, sur Acrimed


3ème étape : supports vidéo

Désormais lourdement armé contre les manipulations, mon co-animateur Philippe Rennard a pris le flambeau pour présenter une série de documents vidéos comme supports de discussion. Il présente, quatre exemples de vidéos et résume les réactions qu’elles ont pu susciter.
Ces commentaires s’inscrivent dans le travail de réflexion de la fabrique du Futur : « Un autre monde du travail est possible… oui, mais lequel ? » 

1/ Serge Dassault et la valeur « travail »

[youtube=http://www.youtube.com/watch?v=cCnEYdhtqJM]

Dans cet exemple Serge Dassault oriente la pression sur les salariés :

  • en comparant l’incomparable, à savoir (bons) travailleurs chinois et (mauvais) français, sans même évoquer les différences abyssales entre les standards socio-productifs des pays respectifs ;
  • en nivelant par le bas : nous devrions culpabiliser de ne pas travailler assez, au lieu de nous mobiliser contre l’exploitation des travailleurs chinois.
C’est un discours qui fait fi des contraintes concurrentielles et des injonctions productivistes
 
 

2/ UMP : la République du travail et du mérite

[youtube=http://www.youtube.com/watch?v=PfnXQixZXvg]Dans cet exemple, Camille Bedin tente de masquer la répartition arbitraire des richesses :

  • sous couvert de l’idée reçue « la réussite ne pourrait s’accomplir en dehors du travail ». C’est la représentation d’un travail qui (par la magie du mérite) engendrerait la réussite sociale qui est inlassablement répétée ici ;
  • sous le concept « d’égalité des chances », cache-sexe des inégalités auxquelles aboutit une économie basée sur le capitalisme. Les déclinaisons récentes de ce concept vont de la Bourse au mérite aux internats d’excellence, structures sujettes aux discriminations positives qui permettront d’entretenir le mythe de l’ascension sociale ;
  • sous la gabegie de « l’assistanat » désignée comme cause de tous les maux économiques et sociaux. Cela résulte pourtant des impasses de l’idéologie du mérite dont le seul partage des richesses n’assurerait certainement pas la paix sociale.

3/ Wauquiez et les contreparties au RSA

[youtube=http://www.youtube.com/watch?v=hp0hX7XMdMs]

Laurent Wauquiez tente dans cet exemple de rendre évident des conditions à l’octroi de minima sociaux :

  • en manipulant les chiffres. Selon lui, un couple au RSA gagnerait plus qu’un couple au SMIC. C’est faux ;
  • en substituant à l’emploi salarié un service bénévole de travail obligatoire ;
  • en plafonnant, c’est-à-dire en réduisant les aides de l’État.

Autant de stratégies qui s’effondreraient avec par exemple un revenu de base inconditionnel.


4/ Un jour sur quatre, un Québécois perd la vie au travail

[youtube=http://www.youtube.com/watch?v=9jwNUlbYIYU]

Dans cet exemple le message tente de concilier santé et travail au sein d’une économie qui les rend profondément incompatibles :

  • on travaille pour gagner notre vie, pas pour la perdre. Difficile de ne pas déceler ici un détournement du slogan « soixante-huitard » « on ne veut pas perdre notre vie à la gagner« . Augmenter la sécurité sur un lieu de travail risqué préserve moins de vies que refuser tout travail dans des conditions hasardeuses.
  • la touche patriotique finale et anthropomorphique (le Québec a besoin de tous ses travailleurs) arrive comme pour convaincre de l’intérêt supérieur de la mobilisation dans l’intérêt du « travail » mais pas forcément des salariés.

Philippe Rennard et Nicolas Gaillard

CorteX_images_chiffres

Le football comme base d'outillage critique en mathématiques en classe de seconde

Julien Pinel, enseignant de Physique-chimie au lycée Doisneau (Lyon) et contributeur du CorteX, nous a invité dans sa classe de seconde pour animer un atelier sur les chiffres dans les médias. Je saisis l’occasion pour rappeler que la formation à l’esprit critique fait partie du programme.
J’ai donc monté un atelier qui avait pour objectifs généraux :
– de démontrer qu’il suffit de sélectionner certaines données chiffrées pour « fabriquer » de l’extraordinaire ;
– d’apprendre à questionner les chiffres pour repérer ces petites (ou grandes) manipulations.

Nous racontons ici comment les statistiques de la ligue 1 de football et les performances du buteur B. Gomis, mais aussi la momie Ötzi, les guérisons miraculeuses de Lourdes ou le triangle des Bermudes nous ont permis de faire sentir aux élèves qu’il est parfois nécessaire de confronter les chiffres.
Cet atelier a été repris dans la foulée par un autre enseignant du lycée Doisneau, Ludovic Arnaud. Il raconte son expérience ici.


Nous avons mené cette séance le 12 Janvier 2012 avec deux demi-classes de seconde.

Compétences critiques visées

  • placer son curseur de vraisemblance
  • questionner les chiffres, les confronter
  • savoir repérer les données chiffrées manquantes

Objectifs de la séance

  • repérer les chiffres dans un document et les classer selon le critère valeur absolue / valeur relative
  • reconstruire une valeur relative à partir de données extraites d’un document
  • faire sentir aux élèves que la seule donnée d’une valeur absolue (et même d’une valeur relative) ne permettent pas forcément de construire un savoir

Description de la séance

  • Durée
    Deux fois la même séance d’1h30, une pour chaque demi-classe
  • Effectifs
    La classe de seconde était scindée en deux groupes de 15 et 16 élèves.
  • Encadrement
    Nous étions deux pour animer l’atelier (Julien Pinel, l’enseignant de physique-chimie de la classe, et moi-même) mais  une petite surprise nous attendait : un autre enseignant de physique-chimie et collègue de Julien, un peu curieux de ce qui allait se passer, s’est joint à nous et a laissé traîné ses oreilles. Un observateur discret et inattendu dont nous attendons avec impatience les retours.
  • Déroulement de la séance
    Le groupe de 16 élèves était scindé en 4 groupes de 4 élèves qui travaillaient chacun sur un sujet différent (voir ci-dessous).

Étape 1 – chaque petit groupe visionne son document (le n°1) puis discussion libre en petit groupe

Étape 2 – Chaque élève énonce en moins d’une ligne l’idée développée dans le document puis place son curseur de vraisemblance ;
Chaque groupe explique rapidement aux autres groupes le sujet de son document.

Étape 3 – Les élèves vont chercher les données chiffrées qui viennent étayer l’idée principale ;
Ils placent leur curseur de vraisemblance ;
Chaque groupe donne rapidement aux autres la liste des chiffres recueillis.

CorteX_Gomis

Étape 4 – Je lance une discussion collective autour de la question suivante : « Gomis (ou tout autre attaquant de leur club préféré) est-il un bon buteur ? » Pour cela, je demande aux férus de football d’essayer de convaincre les autres du fait que B. Gomis est, selon eux, un bon (ou un mauvais) buteur.

Très rapidement, pour justifier leur point de vue, les élèves évoquent :

  • Le nombre de buts marqués par Gomis (en l’occurrence, 7 buts en Ligue 1 au 12 janvier 20011) mais les « non-experts » ne semblent pas convaincus
  • Le nombre de buts marqués + nombre de matchs (7 buts sur 19 matchs, ce qui fait à peu près 1 but tous les 3 matchs ) mais même cette valeur relative ne parle pas beaucoup aux « non-experts » : il leur manque un point de comparaison
  • Ils en arrivent à dire qu’il leur faudrait pouvoir comparer aux résultats des autres buteurs de Ligue 1 (seuls deux buteurs de Ligue 1 ont marqué plus de buts que Bafetimbi Gomis. Il s’agit d’Olivier Giroud – 13 buts sur 19 matchs – et Kevin Gameiro : 9 buts sur 19 matchs)

Ceci nous a permis de mettre en évidence que, si nous ne sommes pas spécialistes d’un sujet, nous avons besoin de points de repères.
Or nous ne sommes en général spécialistes ni en miracles, ni en disparition d’avions, ni en fraude sociale, ni en taux de mortalité chez les scientifiques…

Étape 5 – Les élèves classent les chiffres recueillis selon les critères valeur absolue / valeur relative

Étape 6 – En groupe, ils essaient de reconstruire, si possible, une valeur relative, éventuellement à l’aide du document n°2 si le n°1 ne le permet pas. Ils placent leur curseur de vraisemblance

Étape 7 (de loin la plus difficile) – En groupe, ils essaient de répondre à la question : quel(s) autre(s) chiffres nous auraient été utiles comme point de comparaison  ?

Étape 8 – Julien leur demande, pour le prochain cours, de ramener une valeur absolue et une valeur relative issue du journal télévisé du soir.

Documents utilisés

Nous avions envie de faire travailler les groupes sur des sujets différents pour mettre en évidence le fait que le même processus est très souvent utilisé. Le paranormal est toujours très attractif et a donc motivé mon choix des trois premiers sujets. Julien avait exprimé l’envie de sortir de ce cadre pour montrer que cette manière de faire pouvait aussi être utilisée dans des domaines plus politiques, où la manipulation de l’opinion a des conséquences plus importantes. J’ai donc choisi un document sur la fraude aux prestations sociales.
Il fallait aussi que les documents soient courts, et qu’ils contiennent peu de chiffres pour ne pas noyer les élèves. Voici donc notre récolte :

Poste 1 : Lourdes

Poste 2 : Momie Ötzi

Document 1

{flv}CorteX_TSD_mom1{/flv}

Document 2

{mp4-flv}CorteX_TSD_mom2{/mp4-flv}

Remarque : les données chiffrées récoltées dans les deux documents ne permettent pas de calculer de valeurs relatives. En effet, on nous donne le nombre de victimes depuis 15 ans dans une certaine catégorie de personnes (scientifiques + cameramen + guides de hautes montagnes), le nombre de scientifiques qui sont en contact avec Ötzi aujourd’hui et le nombre de visiteurs du musée en 2007. Ces chiffres ne peuvent être comparés et nous sommes plutôt satisfaits de voir que plusieurs élèves qui ont travaillé sur ce sujet s’en sont rendus compte, même si une petite aide fut nécessaire pour le formaliser.

Poste 3 : Triangle des Bermudes

Document 1

Document 2

CorteX_Chiffres_bermudes_flux_trafic_maritime_2007

En 2007, on peut supposer qu’un porte-container a une capacité moyenne de 2 300 EVP (source : wikipedia, 10 Janvier 2012 – La flotte mondiale comprenait 3 500 porte-conteneurs au début 20061, pour une capacité totale de 8,1 millions d’EVP).

Avec le deuxième document, les élèves sont censés estimer le nombre de bateaux qui traversent la zone du triangle des Bermudes sur une année. Il a fallu les aider un peu à lire cette carte en leur posant quelques questions préliminaires : que représente cette carte ? Où est le triangle des Bermudes, Que représentent les disques ? Ensuite, ils ont pu seuls donner une première estimation du nombre de bateaux ayant traversé le triangle.

Poste 4 : La fraude aux prestations sociales

Document 1

Document 2

Document 1 (extrait de l’article)

Document 1 (extrait de l’article)

Remarque : nous avons supprimé le poste 4 pour la deuxième séance car le document était difficile d’accès et moins attrayant que les trois autres. L’article de journal est vraiment long et donner les extraits sans l’article n’a pas beaucoup de sens, puisque cela revient à faire le travail d’extraction des données chiffrées, travail que les élèves sont censés faire eux-mêmes. Pendant la pause, nous avons décidé de supprimer ce poste pour la deuxième séance, en espérant avoir le temps de le traiter collectivement à la fin ; cela nous aurait donné l’occasion de réinvestir les outils vus en petit groupe, mais nous avons été pris par le temps.
Cela reste un bon outil pour un public plus à l’aise avec l’écrit (je l’ai déjà testé sur un format conférence avec des éducateurs spécialisés).
En conséquence, les groupes de travail sont passés à 5 personnes, ce qui a nui à la qualité des échanges. Il faudra trouver un autre document pour les prochaines fois, par exemple un reportage vidéo issu d’un journal télévisé sur la fraude sociale.

Bilan

Dans l’ensemble, tous les groupes ont bien avancé et nous avons pu aborder tous les points. Ceci dit, l’étape 7 est un peu subtile et aurait mérité qu’on s’attarde un plus longtemps dessus mais le temps nous a un peu manqué. Julien nous dira ce que ses élèves en ont pensé et ce qu’ils ont retenu. En attendant, voici le tableau rempli par la deuxième demi-classe – désolée pour la mauvaise qualité de l’image, je l’ai réalisée avec les moyens du bord. Nous n’avions pas pensé à mettre en place cet outil lors de la première séance, c’est dommage, nous aurions pu comparer les deux productions.

CorteX_Atelier_chiffres_lycee_Doisneau_Tableau_recapitulatif_1
CorteX_Atelier_chiffres_lycee_Doisneau_Tableau_recapitulatif_2

Ce que nous modifierons la prochaine fois

 1. Dans le souci de ne pas trop guider la réflexion des élèves en anticipant sur certaines questions, je n’avais pas prévu de fiche « papier » pour cadrer la séance, mais plutôt un diaporama qui me permettait de faire défiler les questions au fur et à mesure.

Comme me l’a fait remarqué Julien, cette manière de faire a un gros défaut puisque les élèves ne produisent rien et perdent parfois le fil. Il suggérait donc d’utiliser quand même un support écrit. Après discussion, nous proposons de commencer de la même façon jusqu’à l’étape 4 comprise (c’est l’exemple du football) puis de leur distribuer une fiche qui ressemblerait à ça :

1) Quelle est l’idée principale développée dans votre document (une ligne maximum) ?
2) Indépendamment de votre avis sur la question, les arguments développés dans votre document vous paraissent-ils convaincants ? (5 lignes)
3) Quels sont les chiffres avancés pour argumenter en faveur de cette idée ?
4) Après avoir observé l’exemple de Gomis, remplissez la ligne du tableau qui correspond à votre sujet :

 Valeur(s)
absolue(s)
Valeur(s)
relative(s)
Quels chiffres auraient été utiles
comme point de comparaison ?
Exemple de Gomis7 buts7 buts sur 19 matchs
≈ 0,37 buts/matchs
Résultats des autres buteurs de la Ligue 1
Momie Ötzi
Lourdes
Triangle des Bermudes
Fraude au RSA

5) Après ce travail sur les chiffres, que répondriez-vous à quelqu’un qui vous affirmerait, après avoir vu ce document, que Ötzi est une momie maudite ? Ou que Lourdes est une ville miraculeuse ? Ou qu’il y a des disparitions étranges dans le triangle des Bermudes ? (5 lignes maximum)
6) Que retenez-vous de cette séance ? (5 lignes maximum)

Remarque de Julien : il faut garder du temps pour la dernière étape, celle de la conclusion, afin que les élèves s’interrogent eux-mêmes sur ce qu’ils peuvent conclure (ou non) des données présentées dans leur document.
Nous n’avons pas eu le temps non plus de faire en sorte que chaque groupe présente son travail aux autres.

 2. Visiblement, les deux demi-classes ont eu le temps de discuter pendant la pause, ce qui est peut-être à l’origine de réactions très différentes du deuxième groupe par rapport au premier (tous les curseurs de vraisemblance étaient à zéro). Il aurait fallu faire en sorte que les groupes ne se croisent pas ou animer les deux séances simultanément.

 3. A chaque étape, je souhaitais « mesurer » si les débats avait un impact sur l’avis que se faisaient les élèves sur la thèse présentée dans leur document. Je leur ai donc demandé très régulièrement de positionner leur curseur de vraisemblance. A posteriori ce choix ne nous paraît pas très judicieux : nous nous sommes demandés s’il n’y avait pas un phénomène de conformisme qui empêchait certains élèves de placer ce curseur en fonction de leur ressenti personnel. En effet, même si la consigne précisait qu’il n’y avait pas de bonnes ou de mauvaises réponses, comme les groupes étaient petits, chacun pouvait voir où les autres mettaient leur curseur et pouvait se sentir « bête » d’adhérer à telle ou telle idée. Nous n’avons pas les moyens de mesurer cet effet, mais peut-être pourrait-on essayer de mesurer autre chose que leur propre adhésion en leur demandant si l’argumentaire leur paraît pertinent plutôt que de leur demander s’ils y croient. Une autre piste suggérée par Richard Monvoisin est de contrebalancer la crainte d’être ridicule par une crainte plus grande de perdre. Pour cela, on pourrait leur demander : « seriez-vous prêt à miser 100 euros sur le fait que c’est vrai ? Que c’est faux ? »
Si vous testez ce procédé ou si vous avez essayé autre chose, racontez-nous !

4. Notre présence est un élément perturbateur des discussions dans les groupes. Difficile donc d’évaluer cette séance. C’est d’autant plus frustrant que le collègue de Julien, qui a réussi à se fondre dans le paysage, nous a raconté que leurs échanges étaient passionnants. La prochaine fois, on pourrait tenter d’enregistrer leurs échanges à l’aide de dictaphones laissés sur chaque poste, avec l’accord des élèves, bien entendu.

Logistique

Cet atelier repose sur les moyens informatiques, très souvent à l’origine de déconvenues de dernière minute. Quelques précautions sont toujours bonnes à prendre :
– prévoir d’installer les postes quelques jours avant
– s’assurer que tous les ordinateurs sont équipés de logiciels permettant de lire les documents
– s’assurer que tous les ordinateurs ont du son ou s’équiper de casques si besoin
– vérifier que tous les documents sont lisibles en intégralité,
– avoir de toutes façons tous les documents très rapidement accessibles sur son propre ordinateur, des baffles, un vidéoprojecteur, une rallonge et une multiprise pour pouvoir, en cas de pépin, animer la séance en collectif.

Merci à tous les élèves de 2de 5 du lycée Doisneau qui ont travaillé avec enthousiasme.
Merci également à Julien Pinel et à notre invité surprise qui m’ont donné de nombreuses pistes pour améliorer cet atelier.

Guillemette Reviron

CorteX_Florent_Tournus

Effet probabilité Inversée

L’effet probabilité Inversée est une manière trompeuse de présenter les chiffres en jouant sur les probabilités conditionnelles. Notre collègue physicien Florent Tournus a écrit en 2008 un article pour l’Observatoire zététique intitulé « Inconditionnel des probabilités conditionnelles« , si clair que que nous le reproduisons ici. Merci à lui !

Note : un groupe de doctorants-moniteurs du CIES de Grenoble a réalisé en 2010 un Zétéclip sur cet effet. Voir ici.


Les chiffres sont souvent utilisés à des fins de manipulation, de marketing par exemple (les fameux prix en 99 euros ou 99 centimes [1]). Tout le monde le sait, ce n’est pas un scoop. Et pourtant, même en le sachant, il est difficile de ne pas se laisser influencer, de ne pas tomber dans certains « pièges ». Essayer de garder un regard critique sur les chiffres qu’on nous présente (sondages etc.) demande une vigilance permanente. Je voudrais aborder ici un sujet qui, bien qu’éloigné du « paranormal », permet d’exercer son esprit critique : les probabilités ou proportions qui sont données de manière à être interprétées à tort, à créer un fort impact. Cet impact s’appuie sur une mauvaise perception des chiffres avancés, par ce que j’appellerai un effet de « probabilité inversée ».
L’exemple peut-être le plus fameux, mais aussi le plus caricatural – ce qui fait que personne ne tombe (il faut espérer) dans le piège de la « probabilité inversée » – est ce slogan de la Française des jeux : « 100 % des gagnants ont tenté leur chance ». Telle quelle, cette phrase n’apporte en fait aucune information [2] : si on a gagné, c’est forcément qu’on a joué ! Du coup, évidemment, personne n’a gagné sans avoir joué. De manière amusante, on pourrait aussi prendre comme slogan « 100 % des perdants ont tenté leur chance », mais c’est moins vendeur… Ce qui intéresse le joueur, ou le joueur potentiel que la Française des jeux espère appâter, c’est la probabilité de gagner sachant qu’il a joué, et pas la probabilité inverse, c’est-à-dire celle qu’il ait joué sachant qu’il a gagné ! En notation mathématique, si on note A l’événement « je gagne » et B l’événement « je joue », la première probabilité s’écrit [3] P(A/B) qui se lit « probabilité P de A, sachant B » et la seconde P(B/A). Ces probabilités sont appelées probabilités conditionnelles [4]. Vous le voyez tout de suite, P(A/B) n’est absolument pas égal à P(B/A) [5] : la probabilité que je gagne sachant que j’ai joué est extrêmement faible, tandis que la probabilité que j’aie joué sachant que j’ai gagné est de 1 (c’est-à-dire 100 %).
L’effet de « probabilité inversée » est donc le suivant : prendre (à tort) la probabilité de A sachant B, comme probabilité de B sachant A. Bien que ces deux probabilités soient liées, la donnée de l’une d’entre elles (sans autre information) ne permet pas de connaître l’autre. Au mieux, procéder de la sorte n’apporte aucune information réellement utile, au pire cela relève d’une sorte de manipulation : on sait pertinemment quelle est la probabilité qui intéresse le public visé, mais on lui fournit la probabilité de la situation inverse. Dans tous les cas, on n’a pas donné l’information espérée mais on a créé une impression de l’avoir (au moins de manière qualitative).
Prenons un exemple moins trivial de slogan avec « probabilité inversée », que l’on a pu voir sur les panneaux d’autoroutes : « Pas de ceinture : 2 morts sur 5 ». Quel est le but d’un tel message ? Il s’agit clairement d’inciter à mettre sa ceinture de sécurité, en faisant croire que ces chiffres montrent que l’on a bien moins de chances de mourir lorsqu’on porte sa ceinture que lorsqu’on ne la porte pas. Certains auront même vite fait de penser que deux personnes sur cinq qui ne mettent pas leur ceinture meurent  [6]. « C’est faux mais ce n’est pas grave, ça devrait les inciter à mettre leur ceinture » doivent penser les personnes à l’origine de la diffusion de ce message. Remarquons tout d’abord qu’on se doute bien, sans avoir besoin de chiffres, que la ceinture de sécurité protège un minimum ! Ça, c’est du qualitatif. Quant à l’aspect quantitatif, on a l’impression que ce message nous l’indique. Or il n’en est rien, comme on peut s’en rendre compte en regardant de plus près.
J’ouvre une parenthèse. Dans cet exemple, je ne suis même pas convaincu que l’effet « probabilité inversée » fonctionne très bien. On peut en effet convaincre quelqu’un (avec un raisonnement biaisé) que si deux morts sur cinq n’avaient pas mis leur ceinture, alors trois morts sur cinq avaient bien mis leur ceinture [7]. Ceci signifie qu’il y a plus de morts avec ceinture que sans, et donc (c’est là que le raisonnement est faux !) qu’on a plus de chances de mourir quand on met sa ceinture que lorsqu’on ne la met pas [8] ! Je ferme la parenthèse.

Quelles sont les probabilités (ou proportions) qu’il faudrait connaître pour savoir à quel point mettre sa ceinture protège de la mort ? Il faudrait connaître la probabilité de mourir sachant qu’on a sa ceinture, et la comparer à la probabilité de mourir sachant qu’on n’a pas sa ceinture. C’est-à-dire, en notant A l’événement « mourir dans un accident de voiture », B « ne pas mettre sa ceinture » et C « mettre sa ceinture », comparer P(A/B) à P(A/C). Mais que nous donne le message « Pas de ceinture : 2 morts sur 5 » ? Ni P(A/C), ni même P(A/B), mais P(B/A) (la probabilité de ne pas avoir mis sa ceinture, sachant qu’on est mort d’un accident de voiture). Comment donc comparer P(A/B) à P(A/C) en connaissant uniquement P(B/A) ? Cela semble quasiment impossible ! Et pourtant, on sent bien malgré tout  [9] que le slogan indique qu’on a plus de chances de survivre à un accident de voiture quand on met sa ceinture de sécurité. Cela vient peut-être du fait qu’on a une certaine « intuition » des probabilités mises en jeu, qui relient justement P(B/A) à P(A/B) [et P(A/C)].

Prenons notre courage à deux mains et lançons-nous dans une écriture mathématique du problème. Dans la suite, nous allons considérer que les probabilités sont confondues avec les proportions effectivement mesurées sur toute la population ou du moins, sur une grande population [10]. Commençons par préciser quelques notations : nous allons noter N le nombre total d’automobilistes [11], qui se répartissent en NB qui ne mettent pas leur ceinture et NC qui la mettent (on a donc NB + NC = N) et NA le nombre d’automobilistes qui sont morts dans un accident de voiture, qui se répartissent en NA&B qui n’avaient pas mis leur ceinture et NA&C qui l’avaient mise (on a donc NA&B + NA&C = NA). Les différentes probabilités correspondent alors aux proportions suivantes :

P(A&B) = NA&B/N (probabilité d’avoir A et B, « A&B » signifiant « A et B »)
P(B/A) = NA&B/NA et P(A/B) =NA&B/NB
P(A) = NA / N et P(B) = NB / N
P(A) = NA et P(B) = NB
Ces expressions nous permettent de retrouver la formule reliant les différentes probabilités :

P(A&B) = P(B) × P(A/B)

Celle-ci se comprend très bien : en effet, la probabilité d’avoir A et B est donnée par la probabilité d’avoir B, multipliée par la probabilité d’avoir A sachant qu’on a B. En écrivant cela on considère en quelque sorte que pour avoir A et B, on commence par réaliser la condition B, puis on réalise A sachant qu’on a déjà B. On aurait tout aussi bien pu faire passer A « avant » B et écrire que la probabilité d’avoir A et B est égale à la probabilité d’avoir A, multipliée par celle d’avoir B sachant A. Ceci revient à écrire cette seconde égalité, qui est tout aussi vraie :

P(A&B) = P(A) × P(B/A)

En identifiant les deux expressions de P(A&B), le lien entre P(A/B) et P(B/A) apparaît [12] :

P(A) × P(B/A) = P(B) × P(A/B)

ce qui donne :
P(A/B) = P(B/A) × (P(A) / P(B))

Revenons à notre exemple des accidents de la route. Pour connaître la probabilité de mourir sachant qu’on n’a pas mis sa ceinture [c’est-à-dire P(A/B)], à partir de P(B/A) (celle donnée par le message : la probabilité de ne pas avoir sa ceinture, sachant qu’on est mort), il faut connaître P(A) et P(B), c’est-à-dire respectivement la probabilité de mourir d’un accident de la route (indépendamment du fait qu’on ait mis ou pas sa ceinture) et celle de ne pas mettre sa ceinture. Comme nous n’avons pas ces données, nous ne pouvons pas vraiment évaluer P(A/B). Par contre, étant donné que le but du message était de nous « faire peur », de nous inciter à mettre la ceinture, on peut essayer de comparer cette probabilité à celle de mourir sachant qu’on a bien mis sa ceinture de sécurité [c’est-à-dire P(A/C)]. En suivant le même raisonnement que pour P(A/B), on arrive à l’égalité suivante :
 
P(A/C) = P(C/A) × (P(A) / P(C))

et en faisant le rapport de P(A/B) et P(A/C) on obtient :
P(A/B) / P(A/C) = P(B/A) / P(C/A) × P(C) / P(B)

On s’attend à ce que ce rapport soit plus grand que 1 (on a plus de chances de mourir si on n’a pas mis sa ceinture), mais de combien ? Ce que nous dit le message c’est que P(B/A)=2/5, ce qui nous permet de déduire que P(C/A)=3/5 (en effet, si deux morts sur cinq n’avaient pas de ceinture, les trois restants avaient leur ceinture  [13]). Du coup, avec l’information donnée par le message, on aboutit simplement à :
 
P(A/B) / P(A/C) = 2 / 3 ×P(C) = P(B)
 
et comme P(C)=1-P(B) [l’ensemble de la population se sépare en deux groupes uniquement : ceux qui ne mettent pas leur ceinture (B) et ceux qui la mettent (C)], cela peut s’écrire simplement :
 
P(A/B) / P(A/C) = 2 / 3 × (1 – P(B) / P(B))
 
Envisageons maintenant plusieurs cas. Si la proportion P(B) de gens qui conduisent sur l’autoroute sans mettre leur ceinture est de 2/5 on a alors (1-P(B))/P(B) = 3/2 et finalement P(A/B)=P(A/C). Autrement dit, mettre sa ceinture ou pas ne change rien à la probabilité qu’on a de mourir dans un accident ! Cela peut se voir directement d’après les proportions (sans même écrire les expressions mathématiques avec les probabilités conditionnelles) : si la proportion de gens qui ne mettent pas leur ceinture est la même parmi les morts (lors d’un accident de la route) que sur l’ensemble des automobilistes, alors finalement mettre ou non sa ceinture n’a pas d’incidence sur la probabilité de mourir.
En revanche, si la proportion de gens qui ne mettent pas leur ceinture est inférieure à 2/5, cela signifie que les automobilistes sans ceinture sont sur-représentés parmi les morts, et que P(A/B) > P(A/C). La probabilité de mourir est donc plus grande lorsqu’on ne met pas sa ceinture que lorsqu’on la met. Étant donnée que cette conclusion est celle à laquelle on s’attend, prendre le message « Pas de ceinture : 2 morts sur 5 » comme un encouragement à mettre sa ceinture de sécurité signifie qu’on estime implicitement que moins de deux personnes sur cinq ne mettent pas leur ceinture en voiture. En effet, l’information donnée par le message « Pas de ceinture : 2 morts sur 5 » implique qu’on a plus de chances de mourir lorsqu’on ne met pas sa ceinture, si et seulement si la proportion d’automobilistes sans ceinture est inférieure à 40 % (soit 2/5).
Comme quoi, la mise en garde n’est pas évidente (surtout quand on pense que le message est lu sur un panneau d’autoroute…) ! Le plus important, je trouve, est que la proportion donnée de 2/5 n’apporte finalement pas grand chose et qu’en particulier, elle ne permet absolument pas de chiffrer le risque supplémentaire de mourir lorsqu’on ne met pas sa ceinture. Notez que si la proportion de personnes ne mettant pas leur ceinture est connue [14], par exemple 1 sur 10, alors on peut calculer que
 
P(A/B) / P(A/C) = 2/3 × 9 = 6
 
Autrement dit, dans ce cas, ne pas mettre sa ceinture de sécurité revient à multiplier par 6 sa probabilité de mourir [15] ! Je trouve que ce genre de message est bien plus parlant, et quitte à donner un chiffre, sa signification apparaît ici immédiatement.
Le fait qu’on rencontre relativement souvent des messages faisant apparaître un effet de « probabilité inversée » vient peut-être du fait que toutes les données [par exemple ici, P(B)] ne sont pas connues [16]. En effet, il est relativement facile de mesurer la proportion de personnes sans ceinture parmi les morts, mais il est plus difficile de le faire parmi les vivants… Je pense plutôt que des proportions ou des probabilités inexploitables sont données sciemment, pour augmenter l’impact d’un message sur la cible visée. On peut d’ailleurs se poser la question de l’efficacité de ce procédé  [17] : finalement, que retiennent les gens ?
Je suis sûr que vous avez rencontré d’autres messages utilisant cet effet de « probabilité inversée ». Par exemple, il y a eu une campagne dans les journaux annonçant que « 80 % des victimes d’infarctus avant 45 ans sont fumeurs ». Beaucoup traduiront ça par : un fumeur a 80 % de chances de faire un infarctus avant 45 ans. Là encore, pour peu qu’on connaisse la proportion de fumeurs, on pouvait parfaitement transformer ce message en quelque chose comme « Fumer multiplie par 16 le risque de faire un infarctus avant 45 ans » (en faisant le même calcul que pour la ceinture de sécurité, et en considérant, de manière complètement arbitraire, que 20 % des gens sont des fumeurs).
Le procédé est parfois utilisé avec de bonnes intentions : sécurité routière, lutte contre le tabagisme, contre la prise de drogue… (Note de R. Monvoisin – Encore que : lutter contre une servitude volontaire peut se discuter sur le plan moral. Voir Y a-t-il une limite à la liberté de disposer de son propre corps ?), il n’en reste pas moins « pernicieux ». Il faut en effet faire un effort de raisonnement pour comprendre pleinement les implications de ces chiffres. Par ailleurs, cet effet de « probabilité inversée » se conjugue souvent avec un autre : le fameux « effet cigogne [18] » qui consiste à voir un rapport de cause à effet là où il y a une corrélation. Ainsi, lorsqu’un conducteur particulier ne met pas sa ceinture, il n’augmente pas forcément de manière radicale sa probabilité de mourir. En effet, ceux qui ne mettent pas leur ceinture font peut-être plus d’imprudences que ceux qui la mettent, font peut-être plus de route, sont moins vigilants, plus jeunes, plus âgés, que sais-je…
Une phrase comme « 30 % des consommateurs de drogues dures ont commencé par fumer du cannabis » (phrase inventée pour l’occasion, mais vous avez dû en rencontrer des semblables) a toutes les chances d’être interprétée comme « 30 % des fumeurs de cannabis vont prendre des drogues dures et cela, à cause de leur consommation de cannabis ». Maintenant que vous avez tout compris et que vous êtes sensibilisé(e) à l’effet de « probabilité inversée », vous pouvez vous amuser à les repérer et même à en inventer… N’hésitez pas à le coupler à l’effet cigogne pour obtenir de superbes phrases comme celles-ci pour manipuler les gens :
  • « 40 % des porteurs du VIH sont homosexuels » pour laisser penser : « Gare aux homosexuels, ils ont souvent le sida !»
  • « Aux États-Unis, 60 % des condamnés pour viol sont noirs » pour laisser penser : « Attention aux Noirs, ce sont des violeurs ! »
  • « 85 % des pédophiles consultent des sites web pornographiques » pour laisser penser : « Il est sur un site porno, tu te rends comptes, il est peut-être pédophile ! »
  • « 65 % des personnes qui payent l’impôt sur la fortune votent à droite » pour laisser penser : « Ceux qui votent à droite sont très riches »
  • « 70 % des élèves en échec scolaire regardent la télévision plus de 2h par jour » pour laisser penser : « Si mes enfants regardent trop la télévision, ils feront de mauvais élèves »
  • « 80 % des personnes atteintes d’une tumeur au cerveau possèdent un téléphone portable » pour laisser penser : « Les téléphones portables sont dangereux pour la santé ! »
  • « 40 % des chasseurs aiment écouter Robert Charlebois » pour laisser penser : « Tu dois être chasseur, je t’ai entendu siffloter du Robert Charlebois… Non ? Ah bon ! »
Florent Tournus

Notes

[1] Comme on peut le lire, références à l’appui, dans le livre « 100 petites expériences en psychologie du consommateur » de N. Guéguen (Éd. Dunod), au chapitre 1 intitulé « Les prix psychologiques », la terminaison « 9 » d’un prix possède une réelle influence sur le comportement d’achat.
[2] Vous me direz, ce n’est pas le but d’un message publicitaire !
[3] On l’écrit aussi parfois PB(A).
[4] Cette notion est au programme de mathématiques de terminale S, ES et L.
[5] Dans certains cas, les deux probabilités conditionnelles P(A/B) et P(B/A) se « ressemblent » et il faut vraiment réfléchir pour savoir quelle probabilité nous intéresse. Par exemple, dans le cas d’un test permettant de détecter une maladie, est-il préférable de connaître la probabilité que le test soit positif sachant qu’on est malade, ou celle qu’on soit malade sachant que le test est positif ?
[6] Ils meurent, mais quand ça ? Peu doivent se poser la question…
[7] En fait, même ce point n’est pas forcément clair. On peut en effet comprendre différemment le message de la sécurité routière : non pas « sur 5 morts d’un accident, 2 n’avaient pas mis leur ceinture » (ce qui revient effectivement à dire qu’il y a plus de morts « avec ceinture » que « sans ceinture ») mais : « sur 5 morts d’un accident, 2 sont morts à cause du fait qu’ils n’avaient pas mis leur ceinture, et 3 sont morts pour une autre raison ». Notons néanmoins que pour arriver à cette conclusion, il faudrait intégrer au raisonnement une analyse des causes réelles du décès, ce qui est très difficile (impossible ?). Cette ambiguïté du slogan est due à son caractère elliptique et à l’emploi des deux points : ils peuvent exprimer soit la concomitance des deux événements « ne pas avoir sa ceinture » et « être mort », soit un rapport de cause à effet. Et de fait, on peut tout à fait être mort et n’avoir pas mis sa ceinture, et imaginer que, d’après les circonstances de l’accident, on serait mort même si l’on avait mis sa ceinture… Pour la suite, nous considérons que le slogan indique bien uniquement une concomitance : « sur 5 morts d’un accident, 2 n’avaient pas mis leur ceinture ».
[8] On peut d’ailleurs lire ce raisonnement tenu par certains sur le net (certainement de façon humoristique…).
[9] Sauf si l’on suit le raisonnement erroné décrit ci-dessus.
[10] En toute rigueur, comme pour les sondages, on devrait indiquer des intervalles de confiance… mais ce n’est pas de cela que je voudrais parler ici.
[11] Au sens large, car rien n’indique dans le message que seuls les conducteurs sont concernés.
[12] C’est une forme du théorème de Bayes.
[13] Voir la note 7.
[14] Nous disposons d’une masse d’informations via une branche de recherche nommée « accidentologie » qui étudie les accidents et leurs causes. On peut consulter par exemple la section correspondante sur le site de la Sécurité routière.
On y trouve notamment un document intitulé « Les grandes données de l’accidentologie 2006 » qui nous donne cette information sur le port de la ceinture : « Si le port de la ceinture à l’avant était inférieur à 93 % sur les routes de rase campagne il y a dix ans, il atteint aujourd’hui plus de 98 %. En milieu urbain, la progression est spectaculaire, passant de 69,4 % en 1994 à 92,5 % aujourd’hui. Le taux de port de la ceinture aux places arrière est par contre beaucoup plus faible (74,2 % en milieu urbain) ».
Ce document rassemble par ailleurs un grand nombre de données présentant un effet de « probabilité inversée ». En voici quelques unes à titre d’exemple : « 79 % des motocyclistes tués ont entre 15 et 44 ans, et 52 % entre 20 et 34 ans » ; « 51,4 % des personnes tuées à cyclomoteur sont âgées de 15 à 19 ans » ; « 70 % des piétons tués le sont en ville » ; « 74 % des victimes sont des victimes locales : des piétons ou des occupants d’un véhicule immatriculé dans le département » ; « 11,8 % des accidents se sont produits par temps de pluie »… Telles quelles, ces données ne permettent pas de se faire une idée des différents facteurs de risque (mais il y a d’autres informations qui montrent de façon claire que certaines situations correspondent à un risque accru d’accident, comme par exemple « La nuit représente moins de 10 % du trafic mais 35 % des blessés hospitalisés et 44 % des personnes tuées »).
[15] Avec P(B) encore plus faible, le facteur multiplicatif serait encore plus grand.
[16] En fait, comme rappelé dans la note 14, nous disposons d’un grand nombre d’informations…
[17] Peut-être qu’il y a eu des études là-dessus…
[18] C’est le nom donné par Henri Broch à l’erreur qui consiste à confondre causalité et corrélation (voir p. 197 du livre « Le paranormal » d’Henri Broch, Éd. du Seuil).