Entrevue avec Nicolas Gauvrit

A l’occasion d’une conférence donnée à Marseille, Nicolas Gauvrit, Maître de Conférences à l’Université d’Artois et chercheur au laboratoire de didactique de l’Université Paris VII, a accepté de répondre à quelques-unes de nos questions. Nous partageons ici ses réflexions sur le thème de la psychanalyse notamment mais également sur des sujets plus généraux comme le rationalisme, la prise en charge de l’autisme, etc. (La prise de son annexe n’a pas fonctionné, désolé).

Denis Caroti


  1. Zététicien, rationaliste, sceptique ? Comment Nicolas se définit-il ?
  2. Agir de façon rationnelle ? Peut-on croire de façon rationnelle ?
  3. L’inconscient comme fondement des psychanalyses
  4. Les psychanalyses sont-elles « scientifiques » ?
  5. Quels sont les critères pour dire qu’une pratique est « scientifique » ?
  6. Peut-on tester certaines hypothèses psychanalytiques ?
  7. Des hypothèses psychanalytiques ont-elles été validées ?
  8. Psychanalyse et idées reçues
  9. Le refoulement : une idée reçue ?
  10. Le lapsus : idée reçue ?
  11. Lacan et les mathématiques : imposture intellectuelle ?
  12. Psychanalyse et autisme : sophisme « du juste milieu »
  13. Psychanalyse : traiter les causes de l’autisme ?
  14. Les livres qui ont compté
  15. Développer science et esprit critique : un outil de transformation sociale ?
  16. Bibliographie
[dailymotion id=xr55xb]Zététicien, rationaliste, sceptique ? Comment Nicolas se définit-il ?Pourquoi ? Quel est le terme qui convient le mieux pour parler de ses travaux ?
  
[dailymotion id=xr56j2]Agir de façon rationnelle ? Peut-on croire de façon rationnelle ?
  
[dailymotion id=xr5dz0]L’inconscient comme fondement des psychanalyses
  
[dailymotion id=xr56jo]Les psychanalyses sont-elles « scientifiques » ?
  
[dailymotion id=xr56jv]Quels sont les critères pour dire qu’une pratique est « scientifique » ?
  
[dailymotion id=xr56k4]Peut-on tester certaines hypothèses psychanalytiques ?
  
[dailymotion id=xr5f6o]Des hypothèses psychanalytiques ont-elles été validées ?
  
[dailymotion id=xr5fei]Psychanalyse et idées reçues
  
[dailymotion id=xr5fv9]Le refoulement : une idée reçue ?
  
[dailymotion id=xr5g75]Le lapsus : idée reçue ?
  
[dailymotion id=xr5gfc]Lacan et les mathématiques : imposture intellectuelle ?
  
[dailymotion id=xr5hcm]Psychanalyse et autisme : sophisme « du juste milieu »
  
[dailymotion id=xr5i2g]Psychanalyse : traiter les causes de l’autisme ?
  
[dailymotion id=xr5isp]Les livres qui ont compté
  
[dailymotion id=xr5iut]Développer science et esprit critique : un outil de transformation sociale ?
mensonges_freudiensle_singe_en_nous
Impostures_intellectuelles

Bibliographie :
– Le singe en nous, Frans de Waal, Fayard (2006).
– Mensonges freudiens, Jacques Bénesteau, Pierre Mardaga éditeur (2002).
– Impostures intellectuelles, A.Sokal & J.Bricmont, Odile Jacob (1997).

CorteX_images_chiffres

Le football comme base d'outillage critique en mathématiques en classe de seconde

Julien Pinel, enseignant de Physique-chimie au lycée Doisneau (Lyon) et contributeur du CorteX, nous a invité dans sa classe de seconde pour animer un atelier sur les chiffres dans les médias. Je saisis l’occasion pour rappeler que la formation à l’esprit critique fait partie du programme.
J’ai donc monté un atelier qui avait pour objectifs généraux :
– de démontrer qu’il suffit de sélectionner certaines données chiffrées pour « fabriquer » de l’extraordinaire ;
– d’apprendre à questionner les chiffres pour repérer ces petites (ou grandes) manipulations.

Nous racontons ici comment les statistiques de la ligue 1 de football et les performances du buteur B. Gomis, mais aussi la momie Ötzi, les guérisons miraculeuses de Lourdes ou le triangle des Bermudes nous ont permis de faire sentir aux élèves qu’il est parfois nécessaire de confronter les chiffres.
Cet atelier a été repris dans la foulée par un autre enseignant du lycée Doisneau, Ludovic Arnaud. Il raconte son expérience ici.


Nous avons mené cette séance le 12 Janvier 2012 avec deux demi-classes de seconde.

Compétences critiques visées

  • placer son curseur de vraisemblance
  • questionner les chiffres, les confronter
  • savoir repérer les données chiffrées manquantes

Objectifs de la séance

  • repérer les chiffres dans un document et les classer selon le critère valeur absolue / valeur relative
  • reconstruire une valeur relative à partir de données extraites d’un document
  • faire sentir aux élèves que la seule donnée d’une valeur absolue (et même d’une valeur relative) ne permettent pas forcément de construire un savoir

Description de la séance

  • Durée
    Deux fois la même séance d’1h30, une pour chaque demi-classe
  • Effectifs
    La classe de seconde était scindée en deux groupes de 15 et 16 élèves.
  • Encadrement
    Nous étions deux pour animer l’atelier (Julien Pinel, l’enseignant de physique-chimie de la classe, et moi-même) mais  une petite surprise nous attendait : un autre enseignant de physique-chimie et collègue de Julien, un peu curieux de ce qui allait se passer, s’est joint à nous et a laissé traîné ses oreilles. Un observateur discret et inattendu dont nous attendons avec impatience les retours.
  • Déroulement de la séance
    Le groupe de 16 élèves était scindé en 4 groupes de 4 élèves qui travaillaient chacun sur un sujet différent (voir ci-dessous).

Étape 1 – chaque petit groupe visionne son document (le n°1) puis discussion libre en petit groupe

Étape 2 – Chaque élève énonce en moins d’une ligne l’idée développée dans le document puis place son curseur de vraisemblance ;
Chaque groupe explique rapidement aux autres groupes le sujet de son document.

Étape 3 – Les élèves vont chercher les données chiffrées qui viennent étayer l’idée principale ;
Ils placent leur curseur de vraisemblance ;
Chaque groupe donne rapidement aux autres la liste des chiffres recueillis.

CorteX_Gomis

Étape 4 – Je lance une discussion collective autour de la question suivante : « Gomis (ou tout autre attaquant de leur club préféré) est-il un bon buteur ? » Pour cela, je demande aux férus de football d’essayer de convaincre les autres du fait que B. Gomis est, selon eux, un bon (ou un mauvais) buteur.

Très rapidement, pour justifier leur point de vue, les élèves évoquent :

  • Le nombre de buts marqués par Gomis (en l’occurrence, 7 buts en Ligue 1 au 12 janvier 20011) mais les « non-experts » ne semblent pas convaincus
  • Le nombre de buts marqués + nombre de matchs (7 buts sur 19 matchs, ce qui fait à peu près 1 but tous les 3 matchs ) mais même cette valeur relative ne parle pas beaucoup aux « non-experts » : il leur manque un point de comparaison
  • Ils en arrivent à dire qu’il leur faudrait pouvoir comparer aux résultats des autres buteurs de Ligue 1 (seuls deux buteurs de Ligue 1 ont marqué plus de buts que Bafetimbi Gomis. Il s’agit d’Olivier Giroud – 13 buts sur 19 matchs – et Kevin Gameiro : 9 buts sur 19 matchs)

Ceci nous a permis de mettre en évidence que, si nous ne sommes pas spécialistes d’un sujet, nous avons besoin de points de repères.
Or nous ne sommes en général spécialistes ni en miracles, ni en disparition d’avions, ni en fraude sociale, ni en taux de mortalité chez les scientifiques…

Étape 5 – Les élèves classent les chiffres recueillis selon les critères valeur absolue / valeur relative

Étape 6 – En groupe, ils essaient de reconstruire, si possible, une valeur relative, éventuellement à l’aide du document n°2 si le n°1 ne le permet pas. Ils placent leur curseur de vraisemblance

Étape 7 (de loin la plus difficile) – En groupe, ils essaient de répondre à la question : quel(s) autre(s) chiffres nous auraient été utiles comme point de comparaison  ?

Étape 8 – Julien leur demande, pour le prochain cours, de ramener une valeur absolue et une valeur relative issue du journal télévisé du soir.

Documents utilisés

Nous avions envie de faire travailler les groupes sur des sujets différents pour mettre en évidence le fait que le même processus est très souvent utilisé. Le paranormal est toujours très attractif et a donc motivé mon choix des trois premiers sujets. Julien avait exprimé l’envie de sortir de ce cadre pour montrer que cette manière de faire pouvait aussi être utilisée dans des domaines plus politiques, où la manipulation de l’opinion a des conséquences plus importantes. J’ai donc choisi un document sur la fraude aux prestations sociales.
Il fallait aussi que les documents soient courts, et qu’ils contiennent peu de chiffres pour ne pas noyer les élèves. Voici donc notre récolte :

Poste 1 : Lourdes

Poste 2 : Momie Ötzi

Document 1

{flv}CorteX_TSD_mom1{/flv}

Document 2

{mp4-flv}CorteX_TSD_mom2{/mp4-flv}

Remarque : les données chiffrées récoltées dans les deux documents ne permettent pas de calculer de valeurs relatives. En effet, on nous donne le nombre de victimes depuis 15 ans dans une certaine catégorie de personnes (scientifiques + cameramen + guides de hautes montagnes), le nombre de scientifiques qui sont en contact avec Ötzi aujourd’hui et le nombre de visiteurs du musée en 2007. Ces chiffres ne peuvent être comparés et nous sommes plutôt satisfaits de voir que plusieurs élèves qui ont travaillé sur ce sujet s’en sont rendus compte, même si une petite aide fut nécessaire pour le formaliser.

Poste 3 : Triangle des Bermudes

Document 1

Document 2

CorteX_Chiffres_bermudes_flux_trafic_maritime_2007

En 2007, on peut supposer qu’un porte-container a une capacité moyenne de 2 300 EVP (source : wikipedia, 10 Janvier 2012 – La flotte mondiale comprenait 3 500 porte-conteneurs au début 20061, pour une capacité totale de 8,1 millions d’EVP).

Avec le deuxième document, les élèves sont censés estimer le nombre de bateaux qui traversent la zone du triangle des Bermudes sur une année. Il a fallu les aider un peu à lire cette carte en leur posant quelques questions préliminaires : que représente cette carte ? Où est le triangle des Bermudes, Que représentent les disques ? Ensuite, ils ont pu seuls donner une première estimation du nombre de bateaux ayant traversé le triangle.

Poste 4 : La fraude aux prestations sociales

Document 1

Document 2

Document 1 (extrait de l’article)

Document 1 (extrait de l’article)

Remarque : nous avons supprimé le poste 4 pour la deuxième séance car le document était difficile d’accès et moins attrayant que les trois autres. L’article de journal est vraiment long et donner les extraits sans l’article n’a pas beaucoup de sens, puisque cela revient à faire le travail d’extraction des données chiffrées, travail que les élèves sont censés faire eux-mêmes. Pendant la pause, nous avons décidé de supprimer ce poste pour la deuxième séance, en espérant avoir le temps de le traiter collectivement à la fin ; cela nous aurait donné l’occasion de réinvestir les outils vus en petit groupe, mais nous avons été pris par le temps.
Cela reste un bon outil pour un public plus à l’aise avec l’écrit (je l’ai déjà testé sur un format conférence avec des éducateurs spécialisés).
En conséquence, les groupes de travail sont passés à 5 personnes, ce qui a nui à la qualité des échanges. Il faudra trouver un autre document pour les prochaines fois, par exemple un reportage vidéo issu d’un journal télévisé sur la fraude sociale.

Bilan

Dans l’ensemble, tous les groupes ont bien avancé et nous avons pu aborder tous les points. Ceci dit, l’étape 7 est un peu subtile et aurait mérité qu’on s’attarde un plus longtemps dessus mais le temps nous a un peu manqué. Julien nous dira ce que ses élèves en ont pensé et ce qu’ils ont retenu. En attendant, voici le tableau rempli par la deuxième demi-classe – désolée pour la mauvaise qualité de l’image, je l’ai réalisée avec les moyens du bord. Nous n’avions pas pensé à mettre en place cet outil lors de la première séance, c’est dommage, nous aurions pu comparer les deux productions.

CorteX_Atelier_chiffres_lycee_Doisneau_Tableau_recapitulatif_1
CorteX_Atelier_chiffres_lycee_Doisneau_Tableau_recapitulatif_2

Ce que nous modifierons la prochaine fois

 1. Dans le souci de ne pas trop guider la réflexion des élèves en anticipant sur certaines questions, je n’avais pas prévu de fiche « papier » pour cadrer la séance, mais plutôt un diaporama qui me permettait de faire défiler les questions au fur et à mesure.

Comme me l’a fait remarqué Julien, cette manière de faire a un gros défaut puisque les élèves ne produisent rien et perdent parfois le fil. Il suggérait donc d’utiliser quand même un support écrit. Après discussion, nous proposons de commencer de la même façon jusqu’à l’étape 4 comprise (c’est l’exemple du football) puis de leur distribuer une fiche qui ressemblerait à ça :

1) Quelle est l’idée principale développée dans votre document (une ligne maximum) ?
2) Indépendamment de votre avis sur la question, les arguments développés dans votre document vous paraissent-ils convaincants ? (5 lignes)
3) Quels sont les chiffres avancés pour argumenter en faveur de cette idée ?
4) Après avoir observé l’exemple de Gomis, remplissez la ligne du tableau qui correspond à votre sujet :

 Valeur(s)
absolue(s)
Valeur(s)
relative(s)
Quels chiffres auraient été utiles
comme point de comparaison ?
Exemple de Gomis7 buts7 buts sur 19 matchs
≈ 0,37 buts/matchs
Résultats des autres buteurs de la Ligue 1
Momie Ötzi
Lourdes
Triangle des Bermudes
Fraude au RSA

5) Après ce travail sur les chiffres, que répondriez-vous à quelqu’un qui vous affirmerait, après avoir vu ce document, que Ötzi est une momie maudite ? Ou que Lourdes est une ville miraculeuse ? Ou qu’il y a des disparitions étranges dans le triangle des Bermudes ? (5 lignes maximum)
6) Que retenez-vous de cette séance ? (5 lignes maximum)

Remarque de Julien : il faut garder du temps pour la dernière étape, celle de la conclusion, afin que les élèves s’interrogent eux-mêmes sur ce qu’ils peuvent conclure (ou non) des données présentées dans leur document.
Nous n’avons pas eu le temps non plus de faire en sorte que chaque groupe présente son travail aux autres.

 2. Visiblement, les deux demi-classes ont eu le temps de discuter pendant la pause, ce qui est peut-être à l’origine de réactions très différentes du deuxième groupe par rapport au premier (tous les curseurs de vraisemblance étaient à zéro). Il aurait fallu faire en sorte que les groupes ne se croisent pas ou animer les deux séances simultanément.

 3. A chaque étape, je souhaitais « mesurer » si les débats avait un impact sur l’avis que se faisaient les élèves sur la thèse présentée dans leur document. Je leur ai donc demandé très régulièrement de positionner leur curseur de vraisemblance. A posteriori ce choix ne nous paraît pas très judicieux : nous nous sommes demandés s’il n’y avait pas un phénomène de conformisme qui empêchait certains élèves de placer ce curseur en fonction de leur ressenti personnel. En effet, même si la consigne précisait qu’il n’y avait pas de bonnes ou de mauvaises réponses, comme les groupes étaient petits, chacun pouvait voir où les autres mettaient leur curseur et pouvait se sentir « bête » d’adhérer à telle ou telle idée. Nous n’avons pas les moyens de mesurer cet effet, mais peut-être pourrait-on essayer de mesurer autre chose que leur propre adhésion en leur demandant si l’argumentaire leur paraît pertinent plutôt que de leur demander s’ils y croient. Une autre piste suggérée par Richard Monvoisin est de contrebalancer la crainte d’être ridicule par une crainte plus grande de perdre. Pour cela, on pourrait leur demander : « seriez-vous prêt à miser 100 euros sur le fait que c’est vrai ? Que c’est faux ? »
Si vous testez ce procédé ou si vous avez essayé autre chose, racontez-nous !

4. Notre présence est un élément perturbateur des discussions dans les groupes. Difficile donc d’évaluer cette séance. C’est d’autant plus frustrant que le collègue de Julien, qui a réussi à se fondre dans le paysage, nous a raconté que leurs échanges étaient passionnants. La prochaine fois, on pourrait tenter d’enregistrer leurs échanges à l’aide de dictaphones laissés sur chaque poste, avec l’accord des élèves, bien entendu.

Logistique

Cet atelier repose sur les moyens informatiques, très souvent à l’origine de déconvenues de dernière minute. Quelques précautions sont toujours bonnes à prendre :
– prévoir d’installer les postes quelques jours avant
– s’assurer que tous les ordinateurs sont équipés de logiciels permettant de lire les documents
– s’assurer que tous les ordinateurs ont du son ou s’équiper de casques si besoin
– vérifier que tous les documents sont lisibles en intégralité,
– avoir de toutes façons tous les documents très rapidement accessibles sur son propre ordinateur, des baffles, un vidéoprojecteur, une rallonge et une multiprise pour pouvoir, en cas de pépin, animer la séance en collectif.

Merci à tous les élèves de 2de 5 du lycée Doisneau qui ont travaillé avec enthousiasme.
Merci également à Julien Pinel et à notre invité surprise qui m’ont donné de nombreuses pistes pour améliorer cet atelier.

Guillemette Reviron

CorteX_Florent_Tournus

Effet probabilité Inversée

L’effet probabilité Inversée est une manière trompeuse de présenter les chiffres en jouant sur les probabilités conditionnelles. Notre collègue physicien Florent Tournus a écrit en 2008 un article pour l’Observatoire zététique intitulé « Inconditionnel des probabilités conditionnelles« , si clair que que nous le reproduisons ici. Merci à lui !

Note : un groupe de doctorants-moniteurs du CIES de Grenoble a réalisé en 2010 un Zétéclip sur cet effet. Voir ici.


Les chiffres sont souvent utilisés à des fins de manipulation, de marketing par exemple (les fameux prix en 99 euros ou 99 centimes [1]). Tout le monde le sait, ce n’est pas un scoop. Et pourtant, même en le sachant, il est difficile de ne pas se laisser influencer, de ne pas tomber dans certains « pièges ». Essayer de garder un regard critique sur les chiffres qu’on nous présente (sondages etc.) demande une vigilance permanente. Je voudrais aborder ici un sujet qui, bien qu’éloigné du « paranormal », permet d’exercer son esprit critique : les probabilités ou proportions qui sont données de manière à être interprétées à tort, à créer un fort impact. Cet impact s’appuie sur une mauvaise perception des chiffres avancés, par ce que j’appellerai un effet de « probabilité inversée ».
L’exemple peut-être le plus fameux, mais aussi le plus caricatural – ce qui fait que personne ne tombe (il faut espérer) dans le piège de la « probabilité inversée » – est ce slogan de la Française des jeux : « 100 % des gagnants ont tenté leur chance ». Telle quelle, cette phrase n’apporte en fait aucune information [2] : si on a gagné, c’est forcément qu’on a joué ! Du coup, évidemment, personne n’a gagné sans avoir joué. De manière amusante, on pourrait aussi prendre comme slogan « 100 % des perdants ont tenté leur chance », mais c’est moins vendeur… Ce qui intéresse le joueur, ou le joueur potentiel que la Française des jeux espère appâter, c’est la probabilité de gagner sachant qu’il a joué, et pas la probabilité inverse, c’est-à-dire celle qu’il ait joué sachant qu’il a gagné ! En notation mathématique, si on note A l’événement « je gagne » et B l’événement « je joue », la première probabilité s’écrit [3] P(A/B) qui se lit « probabilité P de A, sachant B » et la seconde P(B/A). Ces probabilités sont appelées probabilités conditionnelles [4]. Vous le voyez tout de suite, P(A/B) n’est absolument pas égal à P(B/A) [5] : la probabilité que je gagne sachant que j’ai joué est extrêmement faible, tandis que la probabilité que j’aie joué sachant que j’ai gagné est de 1 (c’est-à-dire 100 %).
L’effet de « probabilité inversée » est donc le suivant : prendre (à tort) la probabilité de A sachant B, comme probabilité de B sachant A. Bien que ces deux probabilités soient liées, la donnée de l’une d’entre elles (sans autre information) ne permet pas de connaître l’autre. Au mieux, procéder de la sorte n’apporte aucune information réellement utile, au pire cela relève d’une sorte de manipulation : on sait pertinemment quelle est la probabilité qui intéresse le public visé, mais on lui fournit la probabilité de la situation inverse. Dans tous les cas, on n’a pas donné l’information espérée mais on a créé une impression de l’avoir (au moins de manière qualitative).
Prenons un exemple moins trivial de slogan avec « probabilité inversée », que l’on a pu voir sur les panneaux d’autoroutes : « Pas de ceinture : 2 morts sur 5 ». Quel est le but d’un tel message ? Il s’agit clairement d’inciter à mettre sa ceinture de sécurité, en faisant croire que ces chiffres montrent que l’on a bien moins de chances de mourir lorsqu’on porte sa ceinture que lorsqu’on ne la porte pas. Certains auront même vite fait de penser que deux personnes sur cinq qui ne mettent pas leur ceinture meurent  [6]. « C’est faux mais ce n’est pas grave, ça devrait les inciter à mettre leur ceinture » doivent penser les personnes à l’origine de la diffusion de ce message. Remarquons tout d’abord qu’on se doute bien, sans avoir besoin de chiffres, que la ceinture de sécurité protège un minimum ! Ça, c’est du qualitatif. Quant à l’aspect quantitatif, on a l’impression que ce message nous l’indique. Or il n’en est rien, comme on peut s’en rendre compte en regardant de plus près.
J’ouvre une parenthèse. Dans cet exemple, je ne suis même pas convaincu que l’effet « probabilité inversée » fonctionne très bien. On peut en effet convaincre quelqu’un (avec un raisonnement biaisé) que si deux morts sur cinq n’avaient pas mis leur ceinture, alors trois morts sur cinq avaient bien mis leur ceinture [7]. Ceci signifie qu’il y a plus de morts avec ceinture que sans, et donc (c’est là que le raisonnement est faux !) qu’on a plus de chances de mourir quand on met sa ceinture que lorsqu’on ne la met pas [8] ! Je ferme la parenthèse.

Quelles sont les probabilités (ou proportions) qu’il faudrait connaître pour savoir à quel point mettre sa ceinture protège de la mort ? Il faudrait connaître la probabilité de mourir sachant qu’on a sa ceinture, et la comparer à la probabilité de mourir sachant qu’on n’a pas sa ceinture. C’est-à-dire, en notant A l’événement « mourir dans un accident de voiture », B « ne pas mettre sa ceinture » et C « mettre sa ceinture », comparer P(A/B) à P(A/C). Mais que nous donne le message « Pas de ceinture : 2 morts sur 5 » ? Ni P(A/C), ni même P(A/B), mais P(B/A) (la probabilité de ne pas avoir mis sa ceinture, sachant qu’on est mort d’un accident de voiture). Comment donc comparer P(A/B) à P(A/C) en connaissant uniquement P(B/A) ? Cela semble quasiment impossible ! Et pourtant, on sent bien malgré tout  [9] que le slogan indique qu’on a plus de chances de survivre à un accident de voiture quand on met sa ceinture de sécurité. Cela vient peut-être du fait qu’on a une certaine « intuition » des probabilités mises en jeu, qui relient justement P(B/A) à P(A/B) [et P(A/C)].

Prenons notre courage à deux mains et lançons-nous dans une écriture mathématique du problème. Dans la suite, nous allons considérer que les probabilités sont confondues avec les proportions effectivement mesurées sur toute la population ou du moins, sur une grande population [10]. Commençons par préciser quelques notations : nous allons noter N le nombre total d’automobilistes [11], qui se répartissent en NB qui ne mettent pas leur ceinture et NC qui la mettent (on a donc NB + NC = N) et NA le nombre d’automobilistes qui sont morts dans un accident de voiture, qui se répartissent en NA&B qui n’avaient pas mis leur ceinture et NA&C qui l’avaient mise (on a donc NA&B + NA&C = NA). Les différentes probabilités correspondent alors aux proportions suivantes :

P(A&B) = NA&B/N (probabilité d’avoir A et B, « A&B » signifiant « A et B »)
P(B/A) = NA&B/NA et P(A/B) =NA&B/NB
P(A) = NA / N et P(B) = NB / N
P(A) = NA et P(B) = NB
Ces expressions nous permettent de retrouver la formule reliant les différentes probabilités :

P(A&B) = P(B) × P(A/B)

Celle-ci se comprend très bien : en effet, la probabilité d’avoir A et B est donnée par la probabilité d’avoir B, multipliée par la probabilité d’avoir A sachant qu’on a B. En écrivant cela on considère en quelque sorte que pour avoir A et B, on commence par réaliser la condition B, puis on réalise A sachant qu’on a déjà B. On aurait tout aussi bien pu faire passer A « avant » B et écrire que la probabilité d’avoir A et B est égale à la probabilité d’avoir A, multipliée par celle d’avoir B sachant A. Ceci revient à écrire cette seconde égalité, qui est tout aussi vraie :

P(A&B) = P(A) × P(B/A)

En identifiant les deux expressions de P(A&B), le lien entre P(A/B) et P(B/A) apparaît [12] :

P(A) × P(B/A) = P(B) × P(A/B)

ce qui donne :
P(A/B) = P(B/A) × (P(A) / P(B))

Revenons à notre exemple des accidents de la route. Pour connaître la probabilité de mourir sachant qu’on n’a pas mis sa ceinture [c’est-à-dire P(A/B)], à partir de P(B/A) (celle donnée par le message : la probabilité de ne pas avoir sa ceinture, sachant qu’on est mort), il faut connaître P(A) et P(B), c’est-à-dire respectivement la probabilité de mourir d’un accident de la route (indépendamment du fait qu’on ait mis ou pas sa ceinture) et celle de ne pas mettre sa ceinture. Comme nous n’avons pas ces données, nous ne pouvons pas vraiment évaluer P(A/B). Par contre, étant donné que le but du message était de nous « faire peur », de nous inciter à mettre la ceinture, on peut essayer de comparer cette probabilité à celle de mourir sachant qu’on a bien mis sa ceinture de sécurité [c’est-à-dire P(A/C)]. En suivant le même raisonnement que pour P(A/B), on arrive à l’égalité suivante :
 
P(A/C) = P(C/A) × (P(A) / P(C))

et en faisant le rapport de P(A/B) et P(A/C) on obtient :
P(A/B) / P(A/C) = P(B/A) / P(C/A) × P(C) / P(B)

On s’attend à ce que ce rapport soit plus grand que 1 (on a plus de chances de mourir si on n’a pas mis sa ceinture), mais de combien ? Ce que nous dit le message c’est que P(B/A)=2/5, ce qui nous permet de déduire que P(C/A)=3/5 (en effet, si deux morts sur cinq n’avaient pas de ceinture, les trois restants avaient leur ceinture  [13]). Du coup, avec l’information donnée par le message, on aboutit simplement à :
 
P(A/B) / P(A/C) = 2 / 3 ×P(C) = P(B)
 
et comme P(C)=1-P(B) [l’ensemble de la population se sépare en deux groupes uniquement : ceux qui ne mettent pas leur ceinture (B) et ceux qui la mettent (C)], cela peut s’écrire simplement :
 
P(A/B) / P(A/C) = 2 / 3 × (1 – P(B) / P(B))
 
Envisageons maintenant plusieurs cas. Si la proportion P(B) de gens qui conduisent sur l’autoroute sans mettre leur ceinture est de 2/5 on a alors (1-P(B))/P(B) = 3/2 et finalement P(A/B)=P(A/C). Autrement dit, mettre sa ceinture ou pas ne change rien à la probabilité qu’on a de mourir dans un accident ! Cela peut se voir directement d’après les proportions (sans même écrire les expressions mathématiques avec les probabilités conditionnelles) : si la proportion de gens qui ne mettent pas leur ceinture est la même parmi les morts (lors d’un accident de la route) que sur l’ensemble des automobilistes, alors finalement mettre ou non sa ceinture n’a pas d’incidence sur la probabilité de mourir.
En revanche, si la proportion de gens qui ne mettent pas leur ceinture est inférieure à 2/5, cela signifie que les automobilistes sans ceinture sont sur-représentés parmi les morts, et que P(A/B) > P(A/C). La probabilité de mourir est donc plus grande lorsqu’on ne met pas sa ceinture que lorsqu’on la met. Étant donnée que cette conclusion est celle à laquelle on s’attend, prendre le message « Pas de ceinture : 2 morts sur 5 » comme un encouragement à mettre sa ceinture de sécurité signifie qu’on estime implicitement que moins de deux personnes sur cinq ne mettent pas leur ceinture en voiture. En effet, l’information donnée par le message « Pas de ceinture : 2 morts sur 5 » implique qu’on a plus de chances de mourir lorsqu’on ne met pas sa ceinture, si et seulement si la proportion d’automobilistes sans ceinture est inférieure à 40 % (soit 2/5).
Comme quoi, la mise en garde n’est pas évidente (surtout quand on pense que le message est lu sur un panneau d’autoroute…) ! Le plus important, je trouve, est que la proportion donnée de 2/5 n’apporte finalement pas grand chose et qu’en particulier, elle ne permet absolument pas de chiffrer le risque supplémentaire de mourir lorsqu’on ne met pas sa ceinture. Notez que si la proportion de personnes ne mettant pas leur ceinture est connue [14], par exemple 1 sur 10, alors on peut calculer que
 
P(A/B) / P(A/C) = 2/3 × 9 = 6
 
Autrement dit, dans ce cas, ne pas mettre sa ceinture de sécurité revient à multiplier par 6 sa probabilité de mourir [15] ! Je trouve que ce genre de message est bien plus parlant, et quitte à donner un chiffre, sa signification apparaît ici immédiatement.
Le fait qu’on rencontre relativement souvent des messages faisant apparaître un effet de « probabilité inversée » vient peut-être du fait que toutes les données [par exemple ici, P(B)] ne sont pas connues [16]. En effet, il est relativement facile de mesurer la proportion de personnes sans ceinture parmi les morts, mais il est plus difficile de le faire parmi les vivants… Je pense plutôt que des proportions ou des probabilités inexploitables sont données sciemment, pour augmenter l’impact d’un message sur la cible visée. On peut d’ailleurs se poser la question de l’efficacité de ce procédé  [17] : finalement, que retiennent les gens ?
Je suis sûr que vous avez rencontré d’autres messages utilisant cet effet de « probabilité inversée ». Par exemple, il y a eu une campagne dans les journaux annonçant que « 80 % des victimes d’infarctus avant 45 ans sont fumeurs ». Beaucoup traduiront ça par : un fumeur a 80 % de chances de faire un infarctus avant 45 ans. Là encore, pour peu qu’on connaisse la proportion de fumeurs, on pouvait parfaitement transformer ce message en quelque chose comme « Fumer multiplie par 16 le risque de faire un infarctus avant 45 ans » (en faisant le même calcul que pour la ceinture de sécurité, et en considérant, de manière complètement arbitraire, que 20 % des gens sont des fumeurs).
Le procédé est parfois utilisé avec de bonnes intentions : sécurité routière, lutte contre le tabagisme, contre la prise de drogue… (Note de R. Monvoisin – Encore que : lutter contre une servitude volontaire peut se discuter sur le plan moral. Voir Y a-t-il une limite à la liberté de disposer de son propre corps ?), il n’en reste pas moins « pernicieux ». Il faut en effet faire un effort de raisonnement pour comprendre pleinement les implications de ces chiffres. Par ailleurs, cet effet de « probabilité inversée » se conjugue souvent avec un autre : le fameux « effet cigogne [18] » qui consiste à voir un rapport de cause à effet là où il y a une corrélation. Ainsi, lorsqu’un conducteur particulier ne met pas sa ceinture, il n’augmente pas forcément de manière radicale sa probabilité de mourir. En effet, ceux qui ne mettent pas leur ceinture font peut-être plus d’imprudences que ceux qui la mettent, font peut-être plus de route, sont moins vigilants, plus jeunes, plus âgés, que sais-je…
Une phrase comme « 30 % des consommateurs de drogues dures ont commencé par fumer du cannabis » (phrase inventée pour l’occasion, mais vous avez dû en rencontrer des semblables) a toutes les chances d’être interprétée comme « 30 % des fumeurs de cannabis vont prendre des drogues dures et cela, à cause de leur consommation de cannabis ». Maintenant que vous avez tout compris et que vous êtes sensibilisé(e) à l’effet de « probabilité inversée », vous pouvez vous amuser à les repérer et même à en inventer… N’hésitez pas à le coupler à l’effet cigogne pour obtenir de superbes phrases comme celles-ci pour manipuler les gens :
  • « 40 % des porteurs du VIH sont homosexuels » pour laisser penser : « Gare aux homosexuels, ils ont souvent le sida !»
  • « Aux États-Unis, 60 % des condamnés pour viol sont noirs » pour laisser penser : « Attention aux Noirs, ce sont des violeurs ! »
  • « 85 % des pédophiles consultent des sites web pornographiques » pour laisser penser : « Il est sur un site porno, tu te rends comptes, il est peut-être pédophile ! »
  • « 65 % des personnes qui payent l’impôt sur la fortune votent à droite » pour laisser penser : « Ceux qui votent à droite sont très riches »
  • « 70 % des élèves en échec scolaire regardent la télévision plus de 2h par jour » pour laisser penser : « Si mes enfants regardent trop la télévision, ils feront de mauvais élèves »
  • « 80 % des personnes atteintes d’une tumeur au cerveau possèdent un téléphone portable » pour laisser penser : « Les téléphones portables sont dangereux pour la santé ! »
  • « 40 % des chasseurs aiment écouter Robert Charlebois » pour laisser penser : « Tu dois être chasseur, je t’ai entendu siffloter du Robert Charlebois… Non ? Ah bon ! »
Florent Tournus

Notes

[1] Comme on peut le lire, références à l’appui, dans le livre « 100 petites expériences en psychologie du consommateur » de N. Guéguen (Éd. Dunod), au chapitre 1 intitulé « Les prix psychologiques », la terminaison « 9 » d’un prix possède une réelle influence sur le comportement d’achat.
[2] Vous me direz, ce n’est pas le but d’un message publicitaire !
[3] On l’écrit aussi parfois PB(A).
[4] Cette notion est au programme de mathématiques de terminale S, ES et L.
[5] Dans certains cas, les deux probabilités conditionnelles P(A/B) et P(B/A) se « ressemblent » et il faut vraiment réfléchir pour savoir quelle probabilité nous intéresse. Par exemple, dans le cas d’un test permettant de détecter une maladie, est-il préférable de connaître la probabilité que le test soit positif sachant qu’on est malade, ou celle qu’on soit malade sachant que le test est positif ?
[6] Ils meurent, mais quand ça ? Peu doivent se poser la question…
[7] En fait, même ce point n’est pas forcément clair. On peut en effet comprendre différemment le message de la sécurité routière : non pas « sur 5 morts d’un accident, 2 n’avaient pas mis leur ceinture » (ce qui revient effectivement à dire qu’il y a plus de morts « avec ceinture » que « sans ceinture ») mais : « sur 5 morts d’un accident, 2 sont morts à cause du fait qu’ils n’avaient pas mis leur ceinture, et 3 sont morts pour une autre raison ». Notons néanmoins que pour arriver à cette conclusion, il faudrait intégrer au raisonnement une analyse des causes réelles du décès, ce qui est très difficile (impossible ?). Cette ambiguïté du slogan est due à son caractère elliptique et à l’emploi des deux points : ils peuvent exprimer soit la concomitance des deux événements « ne pas avoir sa ceinture » et « être mort », soit un rapport de cause à effet. Et de fait, on peut tout à fait être mort et n’avoir pas mis sa ceinture, et imaginer que, d’après les circonstances de l’accident, on serait mort même si l’on avait mis sa ceinture… Pour la suite, nous considérons que le slogan indique bien uniquement une concomitance : « sur 5 morts d’un accident, 2 n’avaient pas mis leur ceinture ».
[8] On peut d’ailleurs lire ce raisonnement tenu par certains sur le net (certainement de façon humoristique…).
[9] Sauf si l’on suit le raisonnement erroné décrit ci-dessus.
[10] En toute rigueur, comme pour les sondages, on devrait indiquer des intervalles de confiance… mais ce n’est pas de cela que je voudrais parler ici.
[11] Au sens large, car rien n’indique dans le message que seuls les conducteurs sont concernés.
[12] C’est une forme du théorème de Bayes.
[13] Voir la note 7.
[14] Nous disposons d’une masse d’informations via une branche de recherche nommée « accidentologie » qui étudie les accidents et leurs causes. On peut consulter par exemple la section correspondante sur le site de la Sécurité routière.
On y trouve notamment un document intitulé « Les grandes données de l’accidentologie 2006 » qui nous donne cette information sur le port de la ceinture : « Si le port de la ceinture à l’avant était inférieur à 93 % sur les routes de rase campagne il y a dix ans, il atteint aujourd’hui plus de 98 %. En milieu urbain, la progression est spectaculaire, passant de 69,4 % en 1994 à 92,5 % aujourd’hui. Le taux de port de la ceinture aux places arrière est par contre beaucoup plus faible (74,2 % en milieu urbain) ».
Ce document rassemble par ailleurs un grand nombre de données présentant un effet de « probabilité inversée ». En voici quelques unes à titre d’exemple : « 79 % des motocyclistes tués ont entre 15 et 44 ans, et 52 % entre 20 et 34 ans » ; « 51,4 % des personnes tuées à cyclomoteur sont âgées de 15 à 19 ans » ; « 70 % des piétons tués le sont en ville » ; « 74 % des victimes sont des victimes locales : des piétons ou des occupants d’un véhicule immatriculé dans le département » ; « 11,8 % des accidents se sont produits par temps de pluie »… Telles quelles, ces données ne permettent pas de se faire une idée des différents facteurs de risque (mais il y a d’autres informations qui montrent de façon claire que certaines situations correspondent à un risque accru d’accident, comme par exemple « La nuit représente moins de 10 % du trafic mais 35 % des blessés hospitalisés et 44 % des personnes tuées »).
[15] Avec P(B) encore plus faible, le facteur multiplicatif serait encore plus grand.
[16] En fait, comme rappelé dans la note 14, nous disposons d’un grand nombre d’informations…
[17] Peut-être qu’il y a eu des études là-dessus…
[18] C’est le nom donné par Henri Broch à l’erreur qui consiste à confondre causalité et corrélation (voir p. 197 du livre « Le paranormal » d’Henri Broch, Éd. du Seuil).

 

 

Sciences politiques & Statistiques – TP Analyse de chiffres sur la délinquance – 3/3

Chiffres et statistiques pleuvent régulièrement dans les nombreux débats sur la délinquance(*), la plupart du temps sans qu’aucune précaution ne soit prise pour replacer ces chiffres dans leur contexte ou pour expliquer ce qu’ils traduisent réellement. Pourtant, ces chiffres, particulièrement difficiles à obtenir aussi bien pour des raisons techniques qu’éthiques, ont un impact très fort sur les représentations que nous nous faisons. Il m’a donc semblé important de faire un bilan de ce qui était vérifié et ce qui ne l’était pas.
Le matériau de base de cet article est le fameux débat entre B. Murat et E. Zemmour chez T. Ardisson.
Une des notions statistiques clés abordées est la notion de surreprésentation.

Dans cette troisième et dernière partie, nous analysons la pertinence des données statistiques ethniques relatives à la délinquance.
* Il y a un effet paillasson dans le mot délinquance, ainsi qu’un effet impact à très forte consonnance négative.  Délinquance, violence ou insécurité sont en effet souvent utilisés à tord et à travers, comme s’il étaient tous trois synonymes et interchangeables. Pourtant, cela ne va pas de soi  (voir l’article de Les Mots Sont Importants) : certains actes délinquants -dans le sens illégaux- ne sont pas violents tandis que d’autres actes violents ne sont pas considérés comme de la délinquance. Comme ce mot est ambigü, l’idéal serait de ne plus l’utiliser.


Extrait de Salut les terriens, 6 Mars 2010.

Retranscription de la fin de la discussion :
B. Murat :
Quand on est contrôlé 17 fois dans la journée, ça modifie le caractère
E. Zemmour :
Mais pourquoi on est contrôlé 17 fois par jour ? Pourquoi ? Parce que la plupart des trafiquants sont noirs et arabes. C’est comme ça, c’est un fait !
B. Murat :
Pas forcément, pas forcément.
E. Zemmour :
Ben, si.

A la suite de cette émission, E. Zemmour déclare dans Le Parisien du 08.03.2010 :
Ce n’est pas un dérapage, c’est une vérité. Je ne dis pas que tous les Noirs et les Arabes sont des délinquants ! Je dis juste qu’ils sont contrôlés plus souvent parce qu’il y a plus de délinquance parmi eux. Demandez à n’importe quel policier.

Analyse des propos d’E. Zemmour : « La plupart des trafiquants sont noirs et arabes. »

  • Quelles statistiques ethniques de la délinquance ?
  • Quelles variables aléatoires ? Quelles sources ? Quelles conclusions ?

Trame du raisonnement :
(a) La plupart des trafiquants sont noirs et arabes
+   (b) Le contrôle d’identité permet d’attraper les trafiquants
=> (c) En contrôlant plus les noirs et les arabes, on attrapera plus de trafiquants,
Pour tester la validité de la prémisse (a), notons que la phrase La plupart des trafiquants sont Noirs et Arabes est une affirmation statistique, mal énoncée certes, mais relevant de la statistique tout de même. E Zemmour sous-entend donc que ces satistiques existent et que quelqu’un a dénombré tous les trafiquants (T), puis les trafiquants Arabes (Ta) ou Noirs (Tn) et a calculé le rapport  (Ta+Tn)/T et a trouvé ainsi une probabilité supérieure à 0,5.

  • Quelles variables statistiques dans la prémisse (a) ?

Le « nombre de trafiquants » est une mauvaise variable statistique. On ne sait même pas de quel trafic on parle : de voitures, de drogue, de subprimes, d’armes, de sous-marins, de cigarettes, d’organes, de diamants, d’oeuvres d’art… ?
On peut supposer qu’E. Zemmour pense au trafic de drogue. Soit. Mais de quelle drogue ?
Comment peut-on compter les trafiquants ? Ceux qu’on a attrapés ? Ceux qui détenaient beaucoup de drogue ? Un peu ? Sont-ils représentatifs de la population des trafiquants ? Considère-t-on qu’on est trafiquant dès lors qu’on a « trafiqué » une fois ?
Une variable statistique pertinente – dans le sens : que l’on peut dénombrer convenablement – serait, par exemple, le « nombre de personnes condamnées pour détention de cannabis ».

« Etre Noir » ou « être Arabe » ou « être Blanc » sont également de mauvaises variables statistiques. Quand commence-t-on ou arrête-t-on d’être Noir, Arabe  ou  Blanc ? Quand un des parents l’est ? Ou bien les deux ? Ou une grand-mère suffirait ? Pour « trancher » la question, certains pensent même à utiliser la consonance du nom de famille, comme cela a déjà été fait dans un article du Point du 24/06/2004 :
Le Point a pu consulter ces notes, dans lesquelles il apparaît que plus de la moitié, voire 60 ou 70%, des suspects répertoriés ont des noms à consonance étrangère. Cet élément est délicat à manipuler. En aucun cas l’on ne saurait déduire avec certitude une origine d’un patronyme. Il ne s’agit pas non plus de tirer des conclusions absurdes sur un caractère « culturel » de la criminalité. Mais écarter ces constatations d’un revers de manche est une grave erreur qui occulte l’échec de l’intégration.
On remarquera que la gravité de la conclusion, occulter l’échec de l’intégration, méritait pourtant qu’on s’assure de la qualité des prémisses du raisonnement.Plus récemment, on a pu lire dans cet article de Marianne2 datant du 12/01/2011 sur le procès d’E. Zemmour :
De son côté, comme l’a révélé Rue89, la défense d’Eric Zemmour a produit une lettre de soutien de Jean-Pierre Chevènement dans laquelle ce dernier confirme la réalité du constat qui vaut l’assignation du prévenu : « Il suffit, comme j’ai eu l’occasion de le faire de consulter les listings de la Direction centrale de la Sécurité publique du ministère de l’intérieur, pour constater que plus de 50% des infractions constatées étaient imputables à des jeunes dont le patronyme est de consonance africaine ou maghrébine. »
On notera également l’effet paillasson : infractions constatées = délinquance, analysé dans la première partie de ce TP.
 
 
  • Quelles sources pour les statistiques ethniques ou raciales dans la prémisse (a) ?

Si le fait d’établir des statistiques ethniques est en général illégal, certaines dérogations sont accordées par la CNIL. Par exemple, elle  peut autoriser sous certaines conditions la collecte d’informations sur le pays d’origine des individus ou de leurs parents (on pourra aller consulter les 10 recommandations de la CNIL ). Comme le rapporte un article du Monde du 05/02/2010 :

De fait, si la loi Informatique et liberté de 1978 énonce une interdiction de principe sur le traitement statistique des données sensibles, elle permet d’y déroger, sous contrôle de la Commission nationale informatique et libertés (CNIL) et à condition de respecter certains critères (consentement individuel, anonymat, intérêt général…).

Notons toutefois qu’il n’existe pas de statistiques sur des « variables » du type Blancs, Arabes et Noirs, à une exception près, exception de taille : à mon grand étonnement je l’avoue, il existe un fichier confidentiel, nommé  Fichier Canonge, qui classe les « délinquants » par « type » physique. Voici ce qu’en dit l’Express du 07/02/2006 :

A quoi ressemblent les délinquants de tous les jours? Pour le savoir, il suffit de se plonger dans un fichier méconnu, baptisé «Canonge», qui comporte l’état civil, la photo et la description physique très détaillée des personnes «signalisées» lors de leur placement en garde à vue. Grâce à cette base de données présentée à la victime, celle-ci peut espérer identifier son agresseur. Or ce logiciel, réactualisé en 2003, retient aujourd’hui 12 «types» ethniques: blanc-caucasien, méditerranéen, gitan, moyen-oriental, nord-africain-maghrébin, asiatique-eurasien, amérindien, indien, métis-mulâtre, noir, polynésien, mélanésien.

Cet outil est à manier avec prudence. D’abord, parce que, même si le Canonge est légal, la Commission nationale de l’informatique et des libertés (Cnil) interdit d’exploiter ses renseignements à d’autres fins que celle de la recherche d’un auteur présumé. Ensuite, parce qu’il ne dit rien de la nationalité et de l’origine de l’individu – qui peut être français depuis plusieurs générations malgré un physique méditerranéen, par exemple. Enfin, parce que les mentions sont portées par l’officier de police, avec la part de subjectivité que cela suppose.

Remarque : les mêmes précautions sont à prendre qu’avec les chiffres du rapport Criminalité et délinquance constatées en France (tris sélectifs de données, prédicion auto-réalisatrice, subjectivité des observateurs…)

  • Quelle population de référence pour établir la surreprésentation dans la prémisse (a) ?

Quand E. Zemmour prétend que la plupart des trafiquants sont Noirs ou Arabes, il énonce un résultat de surreprésentation : les Noirs ou les Arabes sont surreprésentés dans la population des trafiquants. Mais, cela ne vous a pas échappé, cette notion n’a de sens que si l’on connaît la population de référence. Il est probable qu’E. Zemmour considère la population résidant en France, mais cela n’a pas vraiment de sens, puisque toutes ces personnes ne vivent pas forcément dans des conditions externes égales. Pour savoir si les Noirs ou les Arabes sont surreprésentés, il serait préférable de considérer la population « susceptible d’être délinquante » (si tant est qu’on puisse donner un sens rigoureux à cette expression), c’est-à-dire celle qui vit dans les mêmes conditions que les « délinquants ».

  • Quelle probabilité conditionnelle dans l’implication (a)+(b) => c ?

Les prémisses (a) et (b) n’entraînent pas (c). Nous avons là un bel exemple de sophisme Non sequitur, dû à une erreur d’inversion de probabilité conditionnelle.
On retrouve le même sophisme dans les phrases suivantes, où il est plus facile à repérer

La plupart des pédophiles sont Blancs donc il faut plus contrôler les Blancs.
OU
La plupart des inculpés français dans l’affaire des frégates de Taïwan sont Blancs donc il faut plus contrôler les Blancs.
OU
Tous les incestes sont commis par un membre de la famille donc il faut contrôler tous les membres de sa famille

En fait, E. Zemmour s’emmèle les probabilités conditionnelles.

Certes, avec tous les guillemets nécessaires, il est vrai qu’il y a plus de personnes dites « Noires ou Arabes » dans le fichier Canonge que de Blanches ; dans la population totale, les proportions sont inversées. Sans avoir de chiffres précis, on peut donc quand même affirmer qu’on a une probabilité plus grande de tomber sur une personne figurant dans le fichier Canonge (*) en contrôlant les Noirs et les Arabes qu’en contrôlant les Blancs.
Cependant, ce n’est pas ce chiffre qui est important dans le contexte. La question est en fait de savoir si le contrôle d’identité ciblé permet d’arrêter des « délinquants ». Or, ce n’est pas parce que la proportion de Noirs et d’Arabes est importante dans la population des trafiquants – dans ce cas on considère P(N U A/T) – que la proportion de trafiquants est importante dans la population Noire et Arabe – ici on regarde P(T/N U A). Vous en serez encore plus convaincu si vous prenez les autres versions du sophisme.

Exemple :
Imaginons une population composée de 1 000 personnes, dont :
– 400 Noirs ou Arabes
– 600 Blancs
– 7 trafiquants : 5 Noirs ou Arabes et 2 Blancs
Dans cet exemple,
P(NUA / T) = Nombre de Trafiquants Noirs ou Arabes / Nombre de Trafiquants ≈ 71,4%
P(T / NUA) = Nombre de Trafiquants Noirs ou Arabes / Nombre de Noirs ou Arabes ≈ 1,2%
Les ordres de grandeur sont radicalement différents.

Notons qu’E. Zemmour revient sur ce point dans le Parisien et le rectifie. Cependant, quand il dit « Je dis juste qu’ils sont contrôlés plus souvent parce qu’il y a plus de délinquance parmi eux« ,  le parce que légitime la pratique du contrôle et sous-entend qu’on a des chances d’attraper des « trafiquants » de cette manière et donc que la probabilité P(T/A U N) est élevée ; sa prémisse de départ est, rappelons-le, que P(A U N/T)  est élevée.

(*) « Figurer dans le fichier Canonge » et « être délinquant » ne sont pas les mêmes variables ; attention à l’effet paillasson.

  • Quelles conséquences des approximations contenues dans les propos d’E. Zemmour  ?
Ces propos sont très essentialistes même, encore une fois, si ce n’était pas l’intention de l’auteur.  La phrase « la plupart des trafiquants sont Noirs ou Arabes » est très souvent entendue comme « Ils sont délinquants parce qu’ils sont Noirs ou Arabes » (effet cigogne), ce qui n’a aucun fondement scientifique et qui exacerbe le racisme.

Si les statistiques ethniques de la délinquance n’existent pas, certaines personnes ne se privent pourtant pas de les « interpréter ».


Mais au fait, quelle est la probabilité d’attraper un trafiquant lors d’une journée de contrôles d’identité ?
 
Cette partie est conçue pour pousser votre public à être vigilant quand il est question de statistiques, y compris quand c’est vous qui les présentez. Je vous propose pour cela de faire de mauvaises statistiques sans en avoir l’air. Si un membre du public réagit, vous avez gagné la partie. S’il n’y a pas de réactions spontanées, cela vous donnera l’occasion de pointer du doigt

1. la nécessité d’être vigilant en permanence : même averti, on n’est pas à l’abri d’une entourloupe, volontaire ou non,
2. qu’il ne faut pas croire sur parole la personne qui essaie de vous transmettre des outils critiques.

Attention : Mauvaises statistiques ! Les chiffres obtenus dans ce qui suit ne représentent absolument rien.
– Dans l’article de l’Express sur le fichier Canonge, il est dit que sur 103 000 trafiquants fichés, il y a 29% de Nord-Africains et 19% de Noirs.
En tout, cela fait 49 440 trafiquants Noirs ou Arabes.

– On peut évaluer à environ 2 988 745 personnes Noires ou Arabes en France.

– La probabilité de tomber sur un délinquant en contrôlant un Noir ou un Arabe au hasard est donc à peu près de 49 440 / 2 988 745  ≈ 1,7%.

– F. Jobard et R. Lévy rapportent p. 62 que le nombre moyen de contrôles observés par heure est de 1,25. Ce qui fait 8,75 contrôles pour 7 heures travaillées. Disons 9 contrôles par jour.

– En remarquant que la variable aléatoire « nombre de trafiquants attrapés dans la journée » suit une loi binomiale, on obtient la conclusion suivante :
la probabilité d’attraper au moins un trafiquant dans la journée en contrôlant les Noirs et les Arabes est d’environ 14,2%. Sur 100 journées de contrôles d’identité, une équipe qui pratique les contrôles d’identité revient sans trafiquant 85 fois.

Vous venez de créer une occasion pour votre public d’analyser vos propos :
Vous êtes-vous posé la question de savoir d’où sortait le chiffre du nombre de Noirs et Arabes en France ? Ce n’est en fait qu’une estimation, très mauvaise, faite avec les moyens du bord et très critiquable.
Je suis allée sur le site de l’INSEE où figurent des données – cliquer sur Données complémentaires, sur cette page et consulter le graphique 2 – sur le nombre de personnes entre 15 et 50 ans dont au moins un des parents est immigré de Turquie, d’Afrique Subsaharienne, du Maroc, de Tunisie ou d’Algérie : il y en a 1 282 000.
Par ailleurs, sur le site de l’INED, on peut télécharger le document Immigrés selon le sexe, l’âge et le pays de naissance 2007. Dans l’onglet France détail, on peut lire qu’il y a en France en 2007, 1 706 745 immigrés issus du continent Africain et qui ont entre 18 ans et 59 ans.

Ensuite, j’ai appliqué une grande dose de racisme ordinaire : ceux qui viennent (ou dont un parent vient) d’Europe sont blancs, ceux qui viennent du Maghreb sont Arabes et ceux qui viennent d’Afrique Noire sont Noirs. Les Antillais qui sont Français sont comptés comme Blancs, les Français dont les deux parents sont Français sont comptés comme Blancs etc…

Remarquez que, sur wikipedia (version du 19/01/2011), on peut lire

En 2010, la France accueille 6,7 millions d’immigrés (nés étrangers hors du territoire) soit 11% de la population. Elle se classe au sixième rang mondial, derrière les Etats-Unis (42,8 millions), la Russie (12,3), l’Allemagne (9,1), l’Arabie Saoudite (7,3), le Canada (7,2) mais elle devance en revanche le Royaume-uni (6,5) et l’Espagne (6,4). Les enfants d’immigrés, descendants directs d’un ou de deux immigrés, représentaient, en 2008, 6,5 millions de personnes, soit 11 % de la population également. Trois millions d’entre eux avaient leurs deux parents immigrés. Les immigrés sont principalement originaires de l’Union européenne (34 %), du Maghreb (30 %), d’Asie (14 %, dont le tiers de la Turquie) et d’Afrique subsaharienne (11 %).

En reprenant les calculs avec ces chiffres – à savoir 41% de 6,7 millions + 6,5 millions-, on obtient une probabilité d’attraper au moins un trafiquant en une journée de 8% environ. Encore faudrait-il savoir à quoi correspondent ces données exactement ? Les sources de l’article de wikipedia sont :

Les immigrés constituent 11% de la population française [archive], TF1, Alexandra Guillet, le 24 novembre 2010, source : Ined
Etre né en France d’un parent immigré
[archive], Insee Première, N° 1287, mars 2010, Catherine Borel et Bertrand Lhommeau, Insee
 
Bref, le calcul est biaisé et il m’est impossible d’évaluer la marge d’erreur commise. Ce chiffre n’a aucune légitimité et ne pourra être brandi d’aucune manière sur un quelconque plateau télé ou lors d’un quelconque dîner de famille ; il permet tout de même d’énoncer une conclusion : les chiffres ne parlent pas d’eux-mêmes. Il est primordial de savoir comment ils ont été élaborés avant de les utiliser. 
G.R.
 
 
Autres articles sur le sujet (liste non exhaustive) :
Le fait et la justification selon E. Zemmour (Statistix)
« Police et minorité visibles, les contrôles d’identité à Paris » – Quelques réflexions satistiques sur une enquête (Statistix):
présentation de différents indices permettant de mesurer l’intensité de la sur-représentation de certaines populations lors des contrôles de police à 
   la Gare du Nord à Paris.
CorteX_Chiffres_de_la_delinquance_Diagrammes_Surrepresentation

Sciences politiques et Statistiques – TP Analyse de chiffres sur la délinquance – 2/3

Chiffres et statistiques pleuvent régulièrement dans les nombreux débats sur la délinquance(*), la plupart du temps sans qu’aucune précaution ne soit prise pour replacer ces chiffres dans leur contexte ou pour expliquer ce qu’ils traduisent réellement. Pourtant, ces chiffres, particulièrement difficiles à obtenir aussi bien pour des raisons techniques qu’éthiques, ont un impact très fort sur les représentations que nous nous faisons. Il m’a donc semblé important de faire un bilan de ce qui était vérifié et ce qui ne l’était pas.
Le matériau de base de cet article est le fameux débat entre B. Murat et E. Zemmour chez T. Ardisson.
Une des notions statistiques clés abordées ici est la notion de surreprésentation.

Dans cette deuxième partie, nous analysons les données disponibles sur les contrôles d’identité « au faciès ».
* Il y a un effet paillasson dans le mot délinquance, ainsi qu’un effet impact à très forte consonnance négative.  Délinquance, violence ou insécurité sont en effet souvent utilisés à tord et à travers, comme s’il étaient tous trois synonymes et interchangeables. Pourtant, cela ne va pas de soi  (voir l’article de Les Mots Sont Importants) : certains actes délinquants -dans le sens illégaux- ne sont pas violents tandis que d’autres actes violents ne sont pas considérés comme de la délinquance. Comme ce mot est ambigü, l’idéal serait de ne plus l’utiliser.


Extrait de Salut les terriens, 6 Mars 2010.

Retranscription de la fin de la discussion :
B. Murat :
Quand on est contrôlé 17 fois dans la journée, ça modifie le caractère
E. Zemmour :
Mais pourquoi on est contrôlé 17 fois par jour ? Pourquoi ? Parce que la plupart des trafiquants sont noirs et arabes. C’est comme ça, c’est un fait !
B. Murat :
Pas forcément, pas forcément.
E. Zemmour :
Ben, si.

A la suite de cette émission, E. Zemmour déclare dans Le Parisien du 08.03.2010 :
Ce n’est pas un dérapage, c’est une vérité. Je ne dis pas que tous les Noirs et les Arabes sont des délinquants ! Je dis juste qu’ils sont contrôlés plus souvent parce qu’il y a plus de délinquance parmi eux. Demandez à n’importe quel policier.


Analyse des propos de B. Murat : « Quand on est contrôlé 17 fois par jour »

  • Quelles statistiques sur le contrôle d’identité ?
  • Quelles sources disponibles ? Quelle méthodologie ? Quels résultats ?
  • Quelles conséquences d’une mauvaise utilisation des chiffres ?
  • Quelles sources ?

D’où vient le chiffre 17 ? Comme B. Murat ne cite pas ses sources, on peut émettre différentes hypothèses : il connaît quelqu’un qui connaît quelqu’un (Ami d’un ami) et l’information mériterait d’être vérifiée ; ou il utilise une exagération pour mettre en relief son propos (effet impact d’une hyperbole) ; ou il a lu une étude sur le sujet ; ou il propage une idée commune mais non  vérifiée. Je n’ai trouvé trace d’aucune étude énonçant ces chiffres, mais il existe une étude sur le sujet, menée en 2009 par deux membres du CESDIP – laboratoire de recherche du CNRS mais également service d’études du ministère de la Justice – F. Jobard et R. Lévy , intitulée Police et minorité visible : les contrôles d’identité à Paris.
Je n’en ai pas trouvé d’autres. Il est d’ailleurs dit p. 9 du rapport : Cette étude, qui présente des données uniques sur plus de 500 contrôles de police, est la seule menée à ce jour, propre à détecter le contrôle à faciès en France.

  • Quelle méthodologie et quelles notions pour établir des satistiques sur les contrôle au faciès ?

F. Jobard explique la méthodologie employée :

[dailymotion id=xgq4yd]

Les notions de surreprésentation et d’odds-ratio :
Que signifie la phrase « Telle catégorie est plus contrôlée que telle autre » ? Comment le mesurer ?
Quand on parle de surreprésentation, il faut faire attention à ne pas détacher des données importantes ; par exemple, si 10 Noirs et 5 Blancs ont été contrôlés, on ne peut pas affirmer pour autant que les Noirs sont 2 fois plus contrôlés que les Blancs. En effet, si les contrôles se font dans un lieu où se trouvent deux fois plus de Noirs que de Blancs, la population Noire contrôlée n’est pas surrepésentée dans la population contrôlée.CorteX_Chiffres_de_la_delinquance_Diagrammes_Surrepresentation
Dans la première population imaginée, nous avons :
– 1 000 Noirs ou Arabes (bleu)
–    500 Blancs (orange)
–  10 trafiquants Noirs ou Arabes (bleu)
–     2 trafiquants Blancs (orange)
Les Noirs et les Arabes sont surreprésentés.
a
a
a
a
a
a
Dans la deuxième population imaginée, nous avons :
– 1 000 Noirs ou Arabes (bleu)
–    500 Blancs (orange)
–   10 trafiquants Noirs ou Arabes (bleu)
–     5 trafiquants Blancs (orange)
Les Noirs et les Arabes ne sont pas surreprésentés.
a
a
a
a
Il faut donc impérativement connaître la composition de la population globale du lieu d’observation avant de conclure à la surreprésentation et utiliser un outil statistique qui en rende compte, par exemple le odds-ratio dont vous pourrez trouver une définition sur wikipedia.
F. Jobard et R. Lévy nous expliquent comment l’interpréter :
L’odds-ratio compare entre elles les probabilités respectives de contrôle des différents groupes Les odds-ratios présentés dans ce rapport ont tous comparé les groupes relevant des minorités visibles à la population blanche, de sorte que l’odds-ratio se lit de la manière suivante : « Si vous êtes Noir (ou Arabe, etc.), vous avez proportionnellement x fois plus de probabilités d’être contrôlé par la police que si vous étiez Blanc ». L’odds-ratio est reconnu comme la meilleure représentation statistique de la probabilité affectant différents groupes d’une même population compte tenu de la composition de cette population.
L’absence de contrôle au faciès correspond à un odds-ratio de 1,0 : les non-Blancs n’ont pas plus de probabilité d’être contrôlés que les Blancs. Les odds-ratios allant de 1,0 à 1,5 sont considérés comme bénins, ceux allant de 1,5 à 2,0 comme le signe d’un traitement différencié probable. Les ratios supérieurs à 2,0 indiquent qu’il existe un ciblage des minorités par les contrôles de police.
  • Quels sont les résultats de l’étude ?
1. Sur l’ensemble des 5 lieux d’observation, les Noirs (resp. les Arabes) ont entre 3,3 et 11,5 fois (resp. entre 1,8 et  14,8) plus de chances d’être contrôlés que les blancs. Le contrôle « au faciès » est donc avéré.
2. Cependant, d’autres variables sont importantes, en particulier la tenue vestimentaire. Comme il l’est précisé dans le résumé de l’étude p. 10,
Il ressort de notre étude que l’apparence vestimentaire des jeunes est aussi prédictive du contrôle d’identité que l’apparence raciale. L’étude montre une forte relation entre le fait d’être contrôlé par la police, l’origine apparente de la personne contrôlée et le style de vêtements portés : deux tiers des individus habillés « jeunes » relèvent de minorités visibles. Aussi, il est probable que les policiers considèrent le fait d’appartenir à une minorité visible et de porter des vêtements typiquement jeunes comme étroitement liés à une propension à commettre des infractions ou des crimes, appelant ainsi un contrôle d’identité.
Il est important de noter que plusieurs corrélations – entre « être Noir ou Arabe », « être habillé jeune » et « être contrôlé »- sont établies. La relation de causalité « être Noir ou Arabe » implique « être contrôlé » mérite donc d’être discutée. En effet,  si nous exagérons les faits et que nous supposons que tous les Noirs et Arabes et seuls les Noirs et les Arabes s’habillent jeunes, on ne saurait pas si le critère du contrôle est « être Noir ou Arabe » ou « être habillé jeune ».
En réalité, la force prédictive de ces deux variables est à peu près équivalente.[…]En tout état de cause, même si l’apparence vestimentaire était la variable-clé de la décision policière, cela aurait un impact énorme sur les minorités visibles, dans la mesure où leurs membres sont plus susceptibles que les Blancs d’arborer une tenue « jeune ». En effet, deux tiers des personnes en tenue « jeune » appartiennent également à une minorité non-Blanche. Si l’on considère les trois groupes principaux, seulement 5,7% des Blancs de la population de référence portent une tenue « jeune », contre 19% des Noirs et 12,8% des Arabes. En d’autres termes, on peut dire de la variable « tenue jeune » qu’elle est une variable racialisée : lorsque la police cible ce type de tenues, il en résulte une surreprésentation des minorités visibles, en particulier des Noirs, parmi les contrôlés.
 
3. Sur la fréquence des contrôles (attention, ces chiffres sont basés sur la déclaration des personnes contrôlées et n’ont pas été établis de manière scientifique).
À la question de savoir si c’était la première fois qu’elles étaient contrôlées, une grande majorité de personnes interrogées (82%) a répondu par la négative. 38% ont indiqué être contrôlées souvent, 25% ont indiqué avoir été contrôlées de deux à quatre fois par mois, et 16% ont indiqué être contrôlées plus de cinq fois par mois. Il faut remarquer que l’éventail du nombre de contrôles dans cette dernière catégorie était étendu, les personnes indiquant avoir été contrôlées entre cinq et neuf fois le mois précédent, jusqu’à un total de 20 fois.
 
 
  • Quelles conclusions  ?
Il est probable que B. Murat ait gonflé ce chiffre pour appuyer son discours.
Cependant, n’oublions pas que B. Murat est en train de répondre à l’affirmation : « Il y a de la délinquance dans les banlieues ».  On peut alors penser qu’il sous-entend qu’une des causes de cette délinquance est la répétition des contrôles.  Si cela semble plausible pour, par exemple, ce qui concerne le délit d’outrage à agent – en effet, plus on est contrôlé, plus le nombre d’occasions « d’outrager » un agent de police est élevé – je ne connais pas d’étude qui démontrerait cette relation de cause-conséquence dans le cadre général. Ceci est  probablement un effet cigogne.
En revanche, ce que tend à montrer la partie qualitative du rapport de F. Jobard et R. Lévy, c’est que le contrôle d’identité est perçu comme une agression par les personnes qui en sont les cibles, même si la plupart du temps et selon l’avis même des personnes contrôlées, le contrôle est mené sans agressivité de la part des agents.
Malgré le caractère généralement neutre ou positif des jugements sur le comportement de la police, ces contrôles ont suscité des sentiments très négatifs. Quelques personnes ont simplement déclaré que la police ne faisait que son travail et que le contrôle ne les avait pas dérangées. Mais près de la moitié des personnes interrogées ont indiqué être agacées ou en colère du fait du contrôle.[…] Le préjudice que les pratiques de contrôle de police causent à la relation que la police entretient avec les personnes objet de contrôle est manifeste.
Cette pratique est ressentie comme violente et humiliante par ceux qui la vivent donc la question de son efficacité mérite d’être posée. Je précise ma pensée : si le but de la politique est de minimiser la souffrance globale de la population et si le contrôle est vécu comme violent,  il me semble  tout de même nécessaire de s’assurer du fait que cette pratique est indispensable pour lutter contre une autre violence, celle dite « de la délinquance ». Savoir si cette condition est suffisante pour légitimer le contrôle d’identité est encore une autre question.

G.R.

Cliquez ici pour lire la 3ème partie

Sciences politiques et Statistiques – TP Analyse de chiffres sur la délinquance – 1/3

Chiffres et statistiques pleuvent régulièrement dans les nombreux débats sur la délinquance(*), la plupart du temps sans qu’aucune précaution ne soit prise pour replacer ces chiffres dans leur contexte ou pour expliquer ce qu’ils traduisent réellement. Pourtant, ces chiffres, particulièrement difficiles à obtenir aussi bien pour des raisons techniques qu’éthiques, ont un impact très fort sur les représentations que nous nous faisons. Il m’a donc semblé important de faire un bilan de ce qui était vérifié et ce qui ne l’était pas.
Le matériau de base de cet article est le fameux débat entre B. Murat et E. Zemmour chez T. Ardisson.
Une des notions statistiques clés abordées ici est la notion de surreprésentation.

Dans cette première partie, nous nous intéressons à l’élaboration des chiffres de la délinquance.

* Il y a un effet paillasson dans le mot délinquance, ainsi qu’un effet impact à très forte consonnance négative. Délinquance, violence ou insécurité sont en effet souvent utilisés à tort et à travers, comme s’il étaient tous trois synonymes et interchangeables. Pourtant, cela ne va pas de soi (voir l’article de Les Mots Sont Importants) : certains actes délinquants -dans le sens illégaux ne sont pas violents tandis que d’autres actes violents ne sont pas considérés comme de la délinquance. Comme ce mot est ambigu, l’idéal serait de ne plus l’utiliser.


Extrait de Salut les terriens, 6 Mars 2010 :

Retranscription de la fin de la discussion :
B. Murat :
Quand on est contrôlé 17 fois dans la journée, ça modifie le caractère.
E. Zemmour :
Mais pourquoi on est contrôlé 17 fois par jour ? Pourquoi ? Parce que la plupart des trafiquants sont noirs et arabes. C’est comme ça, c’est un fait !
B. Murat :
Pas forcément, pas forcément.
E. Zemmour :
Ben, si.

A la suite de cette émission, E. Zemmour déclare dans Le Parisien du 08.03.2010 :
Ce n’est pas un dérapage, c’est une vérité. Je ne dis pas que tous les Noirs et les Arabes sont des délinquants ! Je dis juste qu’ils sont contrôlés plus souvent parce qu’il y a plus de délinquance parmi eux. Demandez à n’importe quel policier.


Avant-propos

Si le but premier de ce travail est d’analyser ces échanges d’un point de vue statistique, il me semble tout de même nécessaire de commencer par faire quelques remarques :

  • Autorité
    Quelle est la l’expertise de E. Zemmour et B. Murat sur le sujet ? Ont-ils une expertise scientifique c’est-à-dire dépassant le cadre de la simple opinion ? Ont-ils réalisé une étude sociologique sur la question ? Ont-ils réalisé un bilan des connaissances sur le sujet ? Si la réponse est non, il y a de fortes chances qu’ils n’expriment sur ce plateau qu’une opinion personnelle.

Se poser cette question (et aller chercher la réponse) est essentiel pour déceler d’éventuels arguments d’autorité.

  • Source de l’information – Le témoignage
    Quelles sont les sources des deux protagonistes ?
    Pour B. Murat, on ne sait pas.
    Pour E. Zemmour, n’importe quel policier. Mais n’oublions pas ce proverbe critique (ou facette zététique) : un témoignage, mille témoignages, ne font pas une preuve. Le fait que mille personnes assurent avoir vu des soucoupes d’extra-terrestres n’est pas une preuve de leur existence.
  • Prédiction auto-réalisatrice
    Les propos d’E. Zemmour constituent une prédiction auto-réalisatrice. Considérons en effet qu’un délinquant est quelqu’un qui a été qualifié comme tel après avoir été arrêté par la police et acceptons momentanément les prémisses d’E. Zemmour :(a) La plupart des trafiquants sont Noirs et les Arabes
    (b) Le contrôle d’identité est efficace pour détecter des trafiquantsSi une majorité de policiers pensent que la phrase (a) est vraie, ils tendront à contrôler plus les Noirs et les Arabes. Et si la phrase (b) est vraie, ils tendront à trouver, de fait, plus de délinquants Noirs et Arabes. Ils conforteront ainsi les dires d’E. Zemmour. Le fait que les policiers trouvent plus d’Arabes et de Noirs peut donc être une conséquence, et non seulement une cause, du nombre de contrôles accru.
  • Plurium interrogationum, essentialisation et effet cigogne
    Dans la dernière partie de ce travail, nous discutons du sens et de la validité statistique de la phrase Il y a plus de délinquance chez les Noirs et les Arabes, mais nous n’aborderons pas une autre prémisse qui, même si ce n’est pas l’intention de l’auteur, est très souvent entendue dans cette même phrase : Les Noirs et les Arabes sont plus délinquants (par essence) que les Autres.
    L’analyse de cette prémisse, ou plus exactement du raisonnement « Il y a plus de Noirs et d’Arabes en prison ; on peut en déduire que les Noirs et les Arabes sont plus délinquants que les non-Arabes et les non-Noirs » fera l’objet d’un TP à part entière. C’est un bel exemple d’effet cigogne.
    En attendant, vous pouvez lire un article sur ce sujet dans le livre Déchiffrer le monde de Nico Hirtt, intitulé Méfiez-vous des grandes pointures ; il y est expliqué comment d’autres variables sont corrélées, tout autant que la variable « être Noir ou Arabe », à la fréquentation des prisons : pauvreté économique mais aussi niveau scolaire faible, avoir des parents analphabètes ou… avoir de grands pieds – nous laissons soin au lecteur de trouver une raison à cette dernière observation. Ce dernier exemple permet de mesurer à quel point une corrélation interprétée sans précaution comme une causalité peut se révéler être un non-sens total.


Que représentent les chiffres de la délinquance ?

B. Murat comme E. Zemmour s’appuient sur des chiffres pour étayer leurs propos et placent ainsi le débat dans le domaine des statistiques. Ils ont tous les deux beaucoup d’assurance et s’expriment comme si les chiffres allaient de soi et étaient connus de tous.
Or, quand des chiffres sont avancés pour étayer un argumentaire sur la délinquance, il est parfois très difficile de comprendre de quoi l’on parle exactement, ce que l’on aurait voulu dénombrer et ce que l’on a vraiment compté.
D’ailleurs, les organismes qui produisent ces chiffres précisent et décrivent très minutieusement ce qu’ils ont dénombré exactement ; leurs chiffres sont à prendre pour ce qu’ils sont, et non pour ce qu’on voudrait qu’ils soient.

Voici quelques citations parmi d’autres issues de la description de la méthodologie utilisée par la Direction Centrale de la Police Judiciaire pour réaliser le rapport intitulé Criminalité et délinquance constatées en France (2007).

  • Que choisit-on de compter pour décrire la criminalité et la délinquance en France ?

    Page 12 :
    B – LA REPRÉSENTATIVITÉ DES STATISTIQUES
    Que représentent les statistiques de la criminalité et de
    la délinquance constatées par les services de police et les unités de gendarmerie ? Autrement dit, quelles en sont les limites dans le champ des infractions ?
    1 – LE CHAMP DES STATISTIQUES
    Il
    ne comprend pas les infractions constatées par d’autres services spécialisés (Finances, Travail…), les contraventions, les délits liés à la circulation routière ou à la coordination des transports.
    La statistique ne couvre donc pas tout le champ des infractions pénales. Elle est limitée aux crimes et délits
    tels que l’opinion publique les considère. Elle correspond bien à ce que l’on estime relever de la mission de police judiciaire (police et gendarmerie).
Tri sélectif de données : on peut constater un premier tri sélectif des données. Ne sont comptés que les crimes et délits constatés. On sait cependant que dans certains cas, les victimes n’osent pas parler, comme par exemple les victimes de viols, les hommes et les femmes battus ou le harcèlement au travail…Opinion publique pour légitimer un second tri sélectif :

on peut également se demander qui est l’opinion publique et le on qui définissent si clairement ce qu’est ou non une infraction pénale. Et quelles sont les bases qui permettent à l’auteur du rapport d’affirmer que l’opinion publique ne considère pas comme infraction relevant du pénal des infractions au droit du travail, ou les circuits financiers clandestins, le blanchiment d’argent, voire le financement du terrorisme(*), qui relèvent du service TRACFIN du ministère des finances. Un deuxième tri sélectif des données est opéré.

* Le mot terrorisme est un mot qui mériterait un travail à part entière : effet paillasson et effet impact démultipliés.
  • Plus précisément, comment sont créées les variables statistiques (ici, les désignations de tel ou tel délit) ?
Page 13 : 2 – LE RAPPORT DES STATISTIQUES À LA RÉALITÉ
Il n’y a pas de criminalité « en soi » mais des comportements désignés comme illicites par la collectivité. Tout naturellement, ces
comportements sont alors dénombrés à partir des « désignations » que constituent les procédures judiciaires. Un comportement illicite non « désigné » aux autorités judiciaires n’est donc pas pris en compte.
 
« comportements désignés » : par qui ? – Comme illicites : donc en vertu d’une loi, qui peut changer. L’adultère, par exemple, n’est plus puni pénalement depuis 1975.
par la collectivité : qui est la collectivité ? Comment s’exprime-t-elle ?
Au regard des trois derniers points, le Tout naturellement semble pour le moins incongru ; d’autant plus quand, dans la phrase précédente, il est explicitement dit Il n’y a pas de criminalité « en soi ». Il semble donc, au contraire, que la désignation des délits relève d’un choix : il est décidé que l’on comptera un acte comme délit s’il peut être désigné par une des procédures judiciaires répertoriées au préalable, cette liste étant décidée par la collectivité. Et ce choix peut évoluer. Rien de naturel donc.

  • Comment interpréter la variation d’une variable ?
Page 13 : Par ailleurs, il faut noter que le nombre de faits constatés peut s’accroître ou diminuer selon l’importance des moyens mis en oeuvre pour combattre un phénomène (comme par exemple la toxicomanie) ou à la suite de variation dans le mode de sanction des infractions (par exemple, la dépénalisation en 1991 des chèques sans provision d’un faible montant).
Effet cigogne : ce qui se dit ci-dessus permet de prédire une floppée d’effets cigogne dans les médias, lors de repas dominicaux ou sur les terrasses de cafés : la variation d’un chiffre ne reflète pas nécessairement la variation du nombres de délits effectifs mais peut refléter une hausse des moyens mis en oeuvre pour le combattre. C’est un biais très sérieux. Par exemple, plus il y a d’agents sur le terrain pour mesurer la vitesse des automobilistes, plus il y a d’excès de vitesse constatés. Il n’est absolument pas possible d’en conclure qu’il y a de plus en plus de chauffards.
Vous repèrerez quasiment tous les jours des effets cigogne à ce sujet dans vos médias préférés.
  • Comment sont produites les données ?
Page 13 : 3 – LA QUALIFICATION DES FAITS
[…] Chaque fait à comptabiliser est affecté à tel ou tel index de la nomenclature de base en fonction des incriminations visées dans la procédure. Naturellement, il ne s’agit que d’une qualification provisoire attribuée par les agents et officiers de police judiciaire en fonction des crimes et délits que les faits commis ou tentés figurant dans les procédures sont présumés constituer. Seules les décisions de justice établiront la qualification définitive, quelques mois et parfois plus d’une année après la commission des faits. Or, il ne saurait être question d’attendre les jugements pour apprécier l’état de la criminalité, de la délinquance et de ses évolutions.
 
Effet paillasson : une fois les variables créées, il est explicitement dit que, par manque de temps, il n’est pas possible d’attendre une désignation définitive des faits, ce qui rajoute un biais. Comment, en effet, s’assurer que la qualification des faits par un agent de police est celle qui sera retenue par la suite ? D’autant plus que l’agent n’est pas un observateur neutre, la qualification des faits pouvant influencer sa propre évaluation par ses supérieurs ; il est alors envisageable que cela puisse modifier, même de manière involontaire, son évaluation de la situation. Par ailleurs, rien n’assure que la personne poursuivie pour ce crime ou ce délit sera jugée coupable.
  • Conclusion
  • Tris sélectifs et invocation de l’opinion publique pour définir ce qui constitue un acte de délinquance, non indépendance des variables « nombre de délinquants » et « nombre d’agents luttant contre la délinquance », relevé des données biaisé : ces chiffres sont à utiliser avec de nombreuses précautions.
      G.R.

Cliquez ici pour la lire la 2ème partie.

Graphiques, attention aux axes ! Par Nicolas Gauvrit

Le mathématicien Nicolas Gauvrit nous offre du matériel pédagogique « prêt-à-l’emploi », dont l’épisode 1 déconstruit quelques mensonges graphiques, notamment sur les axes.
Pour voir les autres ressources pédagogiques de Nicolas Gauvrit, cliquez ici .

Épisode 1 : Graphiques, attention aux axes !, par Nicolas Gauvrit

Télécharger l’épisode


Note de Guillemette Reviron : lorsque j’ai présenté ce travail de Nicolas Gauvrit au printemps 2011 à un public de travailleurs sociaux, un membre de l’assemblée – que nous remercions – m’a signalé cette séquence du JT de 20h (le 20 Janvier 2011 sur TF1) : Brice Hortefeux, ministre de l’Intérieur à l’époque, venait présenter l’évolution des chiffres de la délinquance et avait préparé pour cela un beau graphique.

  

[dailymotion id=xkzuzk]
 

Après avoir vu la vidéo de Nicolas Gauvrit, cela saute aux yeux : il manque l’axe vertical, celui qui contient toute l’information ; sans parler du titre, particulièrement vague. Le graphique du ministre ne veut tout simplement rien dire.


Cet extrait peut être utilisé de la manière suivante :
– projection de l’extrait du JT
– projection du cours de Nicolas Gauvrit
– nouvelle projection de l’extrait



Voici une autre illustration de l’impact que peut avoir le choix d’une échelle sur un graphique, tiré du Petit Journal du 29 Novembre 2011 (Canal Plus). Merci à Frantz Diguelman de me l’avoir signalé après avoir assisté à un de mes ateliers sur l’usage des chiffres dans les médias.
 
 
[youtube=http://www.youtube.com/watch?v=CwkfDWWYJBs]
 
Les graphiques :
 
 
CorteX_Chiffre_chomage_comparaison_graphique_Le_Petit_journal_29_11_2011_image2CorteX_Chiffre_chomage_comparaison_graphique_Le_Petit_journal_29_11_2011_image3CorteX_Chiffres_chomage_comparaison_graphique_Le_Petit_journal_29_11_2011_Image1
JT – 20h – France 2JT – 20h – France 3JT – 20h – TF1
Guillemette Reviron
alt

Mathématiques et Statistiques – Matériel de cours de Nicolas Gauvrit

Le CorteX a l’immense privilège de mettre disposition le matériel de cours de Nicolas Gauvrit, en format vidéo s’il-vous-plaît !

Mais qui est Nicolas Gauvrit ? Mathématicien, il enseigne à l’université d’Artois et fait partie du groupe européen de psychologie mathématique (EMPG). Il tient le blog Psymath et est l’auteur d’une floppée de bouquins, dont

  • Statistiques. Méfiez-vous ! Paris : Ellipses (2007).
  • Vous avez dit hasard ? Entre mathématiques et psychologie. Paris : Belin/Pour la Science (2009).

et les deux petits derniers

  • Quand les nombres font perdre la boule. Numérologie et folie des grandeurs. Nice : Book-e-Book (2009)
  • avec Jacques Van Rillaer, Les psychanalyses. Des mythologies du XXIème siècle ? Nice : Book-e-Book. (2010)

Il nous propose ici ses vidéos spéciales CorteX directement utilisables en cours par des enseignants.  En libre service. Merci à lui !

Effets Cigogne – corrélation vs. causalité

Corrélation, causalité… Attention, on peut confondre les deux ! C’est ce qu’on appelle l’effet cigogne en zététique. Quelques explications s’imposent pour y voir plus clair…

Corrélation

Deux événements (appelons les X et Y) sont corrélés si l’on observe une dépendance, une relation entre les deux. Par exemple, le nombre de cheveux d’un homme a tendance à diminuer avec l’âge : âge et nombre de cheveux sont donc corrélés.

 

Corrélation ou causalité ?

Une erreur de raisonnement courante consiste à dire : « X et Y sont corrélés, donc X cause Y ». On confond alors corrélation et causalité car en réalité, il se pourrait aussi que Y cause X, ou bien que X et Y aient une cause commune Z, ou encore que X et Y soient accidentellement liés mais n’aient aucun lien de causalité.

 

Effet cigogne ?

cigogne

 

Par exemple, dans les communes qui abritent des cigognes, le taux de natalité est plus élevé que dans l’ensemble du pays. Conclusion : les cigognes apportent les bébés ! Voici une explication plus probable : les cigognes nichent de préférence dans les villages plutôt que dans les grandes agglomérations, et il se trouve que la natalité est plus forte en milieu rural que dans les villes.

Voilà pourquoi l’on nomme « effet cigogne » cette tendance à confondre corrélation et causalité.

Note : des doctorants-moniteurs ont réalisé des Zétéclips sur l’effet cigogne.

  • L’un sur l’exemple de la lune rousse (voir ici)
  • L’autre plus transversal, avec illustration sur le chat du Dr House (voir )

Quelques exemples…

Voici quelques effets « cigogne » classiques pour illustrer vos démonstrations. Pour certaines, nous avons quelques proposition d’explication, pour d’autres, à vous de jouer !

  • Le fait de dormir avec des chaussures est corrélé au fait de se réveiller avec le mal de tête. Peut-on en conclure que dormir avec des chaussures fait mal à la tête ? Une explication plus vraisemblable est que ces deux événements font suite à des soirées trop arrosées…
  • Les climatologues ne peuvent nier le phénomène : plus la température globale de la planète augmente, plus les sous-vêtements féminins  rétrécissent. Peut-on en conclure que le réchauffement climatique entraîne la diminution de la taille des culottes ? Il semble pourtant que la véritable explication soit à chercher du côté de la mode…

CorteX_climat

  • Imaginons que la consommation de cannabis soit corrélée avec des résultats CorteX_fumeurscolaires inférieurs à la moyenne. Il se peut que fumer soit la cause de moins bons résultats. Mais il se peut aussi qu’avoir de moins bons résultats conduise à fumer. Ou encore que les gens plus sociables tendent à la fois à fumer du cannabis et à prendre leurs résultats moins au sérieux.
  • Plus une entreprise compte de femmes cadres dans ses effectifs, moins son cours de Bourse a baissé depuis le début de l’année. (Le Monde, 16/10/2008, dans “Les femmes, antidote à la crise boursière”) (le choix du titre vous paraît-il pertinent ?)
  • Plus il y a de pompiers combattant un incendie, plus les dégâts seront importants. On pourrait alors espérer que la caserne la plus proche soit presque vide de réservistes. L’explication vraisemblable est certainement que plus l’incendie est grave, plus le nombre de pompiers pour le combattre est important.
  • La sensation d’avoir froid précède généralement une affection fébrile. Peut-on en conclure qu’avoir froid déclenche ces affections ? Contrairement à une opinion répandue, le fait d’être assis sur des bancs de pierre froide, de marcher avec des chaussettes mouillées ou de sortir après s’être lavé les cheveux n’entraîne pas la sensation de froid ou la fièvre. La sensation de froid constitue le premier symptôme de la fièvre.
  • Il existe une corrélation positive entre utilisation de crème solaire et cancer de la peau. Peut-on en conclure qu’il ne faut plus utiliser de crème solaire lorsque vous allez à la plage ?
  • Les ventes de crèmes glacées augmentent avec le nombre de morts par noyade. Peut-on en conclure qu’il serait urgent de mettre en prison tous ces criminels qui nous proposent leurs sorbets sans penser aux conséquences ?
  • Une étude japonaise portant sur 40 000 quadragénaires montre que ceux qui se brossent les dents après chaque repas parviennent mieux que les autres à garder la ligne. Peut-on en conclure que les régimes sont inutiles pourvu que votre entretien buccal soit impeccable ?
  • Le prix des cigarettes est négativement corrélé au nombre des agriculteurs en Lozère. Peut-on en conclure que le lobby du tabac est partout ?
  • La longévité moyenne est supérieure dans les pays où l’on mange le plus de viande. Peut-on en conclure que si vous mangez uniquement de la viande, vous vivrez vieux ?
  • Le nombre d’écoles maternelles dans une ville est positivement corrélé au nombre de crimes et délits. Peut-on en conclure que repousser nos écoles en banlieue sauverait des vies ?
  • Dans les grandes villes, les gens portent statistiquement moins souvent assistance à leurs congénères qu’en milieu rural. Peut-on en conclure que l’urbanisation a déshumanisée nos relations ?
  • Des chercheurs de la faculté de médecine de l’Université de Pittsburgh, en Pennsylvanie, ont déterminé le temps passé à regarder la télévision, devant un ordinateur à jouer à des jeux vidéo notamment, ou à écouter la radio, de 4 142 adolescents qui ne souffraient pas de dépression au début de l’étude en 1995. Ils ont alors constaté que des risques nettement plus grands de dépression étaient corrélés avec le nombre d’heures passées devant la télévision ou les jeux vidéos. Peut-on en conclure que le fait de consacrer un long moment à regarder la télévision ou à jouer à des jeux vidéo contribue au développement de symptômes dépressifs ?
  •  Coca-cola et le père Noël : Nos amis de Hoaxbuster le résument ainsi : CorteX_dead_pere_Noel« Avant, le Père Noël était vert, Coca-Cola a fait une pub avec un Père Noël rouge, donc Coca-Cola a changé la couleur du Père-Noël ! » (merci à Nico, Hoaxbuster Team).
  • Si l’on enquête sur les accidents de circulation survenus entre 9 et 11h du matin, on se rend compte que 80% des conducteurs avaient bu du café dans les 3h précédant l’accident. Réflexion : faut-il à l’instar de l’alcool, interdire ou restreindre l’absorption de café au volant ? A quand le caféinotest ? (merci à la Dr Monique Dupas Chauny)
  • Faire la vaisselle nuit à l’activité sexuelle,

(…) plus un homme marié accorde de temps aux tâches ménagères comme la cuisine ou les courses, moins il a de relations sexuelles, affirme une étude publiée dans la Revue Américaine de Sociologie de février 2013. Et l’inverse est vrai s’il se consacre davantage à la voiture ou au jardin, assure l’étude «Egalitarisme, travail ménager et fréquence des rapports sexuels dans le mariage» (…)

  •  Le site (anglophone) de Tyler Vigen recense un paquet de corrélations CorteX_Tyler_Vigen_spurious-correlations-bookfumeuses, éditées récemment en livre. Merci à Jordane Billon pour cette base de données incomparable.

 

 

  • Lien entre fille en pantalon et syndrome des ovaires polykystiques

CorteX_Calamity_Jane« I have heard theories on why girls suffer from PCOD at an early age. When they dress like men, they start thinking or behaving like them. There is a gender role reversal in their head. Due to this, the natural urge to reproduce diminishes right from a young age and therefore they suffer from problems like PCODs (Poly Cystic Ovarian Disease). »

Traduction-maison : « J’ai entendu des théories sur les raisons de l’apparition du syndrome des ovaires polykystiques à un âge précoce. Quand les filles s’habillent comme des garçons, elles commencent à penser ou se comporter comme eux. Il y a un renversement du rôle du genre dans leur tête. En vertu de quoi, l’envie naturelle de se reproduire décroit, et cela à un jeune âge, et par conséquent, elles souffrent de problèmes comme le syndrome des ovaires polykystiques. »

On doit ce magnifique effet cigogne à Swati Deshpande, présidente du Collège polytechnique gouvernemental, à Bandra, municipalité située dans la banlieue ouest de Bombay. Les propos sont rapporté par The Times of India du 7 février 2017.

Pour le dépaysement, cette vidéo, sans sous-titre, de Namn news.

Vous aussi, vous tenez un effet cigogne ? Envoyez-le nous !