CorteX_Chiffres_de_la_delinquance_Diagrammes_Surrepresentation

Sciences politiques et Statistiques – Analyse de chiffres sur la délinquance

Dans les nombreux débats sur la délinquance 1 pleuvent chiffres et statistiques, la plupart du temps sans qu’aucune précaution ne soit prise pour replacer ces chiffres dans leur contexte ou pour expliquer ce qu’ils traduisent réellement.
Pourtant, ces chiffres, particulièrement difficiles à obtenir que ce soit pour des raisons techniques ou éthiques, ont un impact très fort sur les représentations que nous nous faisons de la situation. Il m’a donc semblé important de faire un bilan de ce qui était vérifié et ce qui ne l’était pas, pour lutter contre les idées reçues et leurs conséquences sociales.
 
Le matériau de base de cet article est le fameux débat entre B. Murat et E. Zemmour chez T. Ardisson.
Une des notions statistiques clés abordées ici est la notion de surreprésentation.

Extrait de Salut les terriens, 6 Mars 2010.

Retranscription de la fin de la discussion :
B. Murat :
Quand on est contrôlé 17 fois dans la journée, ça modifie le caractère
E. Zemmour :
Mais pourquoi on est contrôlé 17 fois par jour ? Pourquoi ? Parce que la plupart des trafiquants sont noirs et arabes. C’est comme ça, c’est un fait !
B. Murat :
Pas forcément, pas forcément.
E. Zemmour :
Ben, si.

A la suite de cette émission, E. Zemmour déclare dans Le Parisien du 08.03.2010 :

Ce n’est pas un dérapage, c’est une vérité. Je ne dis pas que tous les Noirs et les Arabes sont des délinquants ! Je dis juste qu’ils sont contrôlés plus souvent parce qu’il y a plus de délinquance parmi eux. Demandez à n’importe quel policier.

Avant-propos

Si le but premier de ce travail est d’analyser ces échanges d’un point de vue statistique, il me semble tout de même nécessaire de commencer par faire quelques remarques :

  • Autorité
    Quelle est la l’expertise de E. Zemmour et B. Murat sur le sujet ? Ont-ils une expertise scientifique c’est-à-dire dépassant le cadre de la simple opinion ? Ont-ils réalisé une étude sociologique sur la question ? Ont-ils réalisé un bilan des connaissances sur le sujet ? Si la réponse est non, il y a de fortes chances qu’ils n’expriment sur ce plateau qu’une opinion personnelle. Se poser cette question (et aller chercher la réponse) est essentiel pour déceler d’éventuels arguments d’autorité.
  • Source de l’information – Le témoignage
    Quelles sont les sources des deux protagonistes ?
    Pour B. Murat, on ne sait pas.
    Pour E. Zemmour, n’importe quel policier. Mais n’oublions pas ce proverbe critique (ou facette zététique) : un témoignage, mille témoignages, ne font pas une preuve. Le fait que mille personnes assurent avoir vu des soucoupes d’extra-terrestres n’est pas une preuve de leur existence.
  • Prédiction auto-réalisatrice
    Les propos d’E. Zemmour constituent une prédiction auto-réalisatrice. Considérons en effet qu’un délinquant est quelqu’un qui a été qualifié comme tel après avoir été arrêté par la police et acceptons momentanément les prémisses d’E. Zemmour :
    (a) La plupart des trafiquants sont Noirs et les Arabes
    (b) Le contrôle d’identité est efficace pour détecter des trafiquants.
    Si une majorité de policiers pensent que la phrase (a) est vraie, ils tendront à contrôler plus les Noirs et les Arabes. Et si la phrase (b) est vraie, ils tendront à trouver, de fait, plus de délinquants Noirs et Arabes. Ils conforteront ainsi les dires d’E. Zemmour.
  • Plurium interrogationum, essentialisation et effet cigogne
    Dans la dernière partie de ce travail, nous discutons du sens et de la validité statistique de la phrase Il y a plus de délinquance chez les Noirs et les Arabes, mais nous n’aborderons pas une autre prémisse qui, même si ce n’est pas l’intention de l’auteur, est très souvent entendue dans cette même phrase : Les Noirs et les Arabes sont plus délinquants (par essence) que les Autres.
    L’analyse de cette prémisse, ou plus exactement du raisonnement Il y a plus de Noirs et d’Arabes en prison ; on peut en déduire que les Noirs et les Arabes sont plus délinquants que les Autres fera l’objet d’un TP à part entière. C’est un bel exemple d’effet cigogne.
    En attendant, vous pouvez lire un article sur ce sujet dans le livre Déchiffrer le monde de Nico Hirtt, intitulé Méfiez-vous des grandes pointures ; il y est expliqué comment d’autres variables sont corrélées, tout autant que la variable « être Noir ou Arabe », à la fréquentation des prisons : pauvreté économique mais aussi niveau scolaire faible, avoir des parents analphabètes ou… avoir de grands pieds – nous laissons soin au lecteur de trouver une raison à cette dernière observation. Ce dernier exemple permet, il me semble, de mesurer à quel point une corrélation interprétée sans précaution comme une causalité peut se révéler être un non sens total.

Première partie : que représentent les chiffres de la délinquance ?

B. Murat comme E. Zemmour s’appuient sur des chiffres pour étayer leurs propos et placent ainsi le débat dans le domaine des statistiques. Ils ont tous les deux beaucoup d’assurance et s’expriment comme si les chiffres allaient de soi et étaient connus de tous.
Or, quand des chiffres sont avancés pour étayer un argumentaire sur la délinquance, il est parfois très difficile de comprendre de quoi l’on parle exactement, ce que l’on aurait voulu dénombrer et ce que l’on a vraiment compté.
D’ailleurs, les organismes qui produisent ces chiffres précisent et décrivent très minutieusement ce qu’ils ont dénombré exactement ; leurs chiffres sont à prendre pour ce qu’ils sont, et non pour ce qu’on voudrait qu’ils soient.

Voici quelques citations parmi d’autres issues de la description de la méthodologie utilisée par la Direction centrale de la police judiciaire pour réaliser le rapport intitulé Criminalité et délinquance constatées en France (2007).

Que choisit-on de compter pour décrire la criminalité et la délinquance en France ?

Page 12 : B – LA REPRÉSENTATIVITÉ DES STATISTIQUES
Que représentent les statistiques de la criminalité et de la délinquance constatées par les services de police et les unités de gendarmerie ? Autrement dit, quelles en sont les limites dans le champ des infractions ?

1 – LE CHAMP DES STATISTIQUES
Il ne comprend pas les infractions constatées par d’autres services spécialisés (Finances, Travail…), les contraventions, les délits liés à la circulation routière ou à la coordination des transports.
La statistique ne couvre donc pas tout le champ des infractions pénales. Elle est limitée aux crimes et délits tels que l’opinion publique les considère. Elle correspond bien à ce que l’on estime relever de la mission de police judiciaire (police et gendarmerie).

Tri sélectif de données : on peut constater un premier tri sélectif des données : ne sont comptés que les crimes et délits constatés. On sait cependant que dans certains cas, les victimes n’osent pas parler, comme par exemple les victimes de viols, les hommes et les femmes battus ou le harcèlement au travail…

Opinion publique pour légitimer un second tri sélectif : on peut également se demander qui est l’opinion publique et le on qui définissent si clairement ce qu’est ou non une infraction pénale. Et quelles sont les bases qui permettent à l’auteur du rapport d’affirmer que l’opinion publique ne considère pas comme infraction relevant du pénal des infractions au droit du travail, ou les circuits financiers clandestins, le blanchiment d’argent, voire le financement du terrorisme 2, qui relèvent du service TRACFIN du ministère des finances. Un deuxième tri sélectif des données est opéré.


Plus précisément, comment sont créées les variables statistiques (ici, les désignations de tel ou tel délit) ?

Page 13 : 2 – LE RAPPORT DES STATISTIQUES À LA RÉALITÉ
Il n’y a pas de criminalité « en soi » mais des comportements désignés comme illicites par la collectivité. Tout naturellement, ces comportements sont alors dénombrés à partir des « désignations » que constituent les procédures judiciaires. Un comportement illicite non « désigné » aux autorités judiciaires n’est donc pas pris en compte.

«comportements désignés» : par qui ?
Comme illicites : donc en vertu d’une loi, qui peut changer ; par exemple, l’adultère n’est plus puni pénalement depuis 1975
– par la collectivité : qui est la collectivité ? Comment s’exprime-t-elle ?

Au regard des trois derniers points, le Tout naturellement semble pour le moins incongru ; d’autant plus quand, dans la phrase précédente, il est explicitement dit Il n’y a pas de criminalité « en soi ». Il semble donc, au contraire, que la désignation des délits relève d’un choix : il est décidé que l’on comptera un acte comme délit s’il peut être désigné par une des procédures judiciaires répertoriées au préalable, cette liste étant décidée par la collectivité. Et ce choix peut évoluer. Rien de naturel donc.

Comment interpréter la variation d’une variable ?

Page 13 : Par ailleurs, il faut noter que le nombre de faits constatés peut s’accroître ou diminuer selon l’importance des moyens mis en oeuvre pour combattre un phénomène (comme par exemple la toxicomanie) ou à la suite de variation dans le mode de sanction des infractions (par exemple, la dépénalisation en 1991 des chèques sans provision d’un faible montant)

Effet cigogne : ce qui se dit ci-dessus permet de prédire une floppée d’effets cigognes dans les médias, lors de repas dominicaux ou sur les terrasses de cafés : la variation d’un chiffre ne reflète pas nécessairement la variation du nombres de délits effectifs mais peut refléter une hausse des moyens mis en oeuvre pour le combattre. C’est un biais très sérieux. Par exemple, plus il y a d’agents sur le terrain pour mesurer la vitesse des automobilistes, plus il y a d’excès de vitesse constatés. Il n’est absolument pas possible d’en conclure qu’il y a de plus en plus de chauffards.
Vous repèrerez quasiment tous les jours des effets cigognes à ce sujet dans vos médias préférés.


Comment sont produites les données ?

Page 13 : 3 – LA QUALIFICATION DES FAITS
[…] Chaque fait à comptabiliser est affecté à tel ou tel index de la nomenclature de base en fonction des incriminations visées dans la procédure. Naturellement, il ne s’agit que d’une qualification provisoire attribuée par les agents et officiers de police judiciaire en fonction des crimes et délits que les faits commis ou tentés figurant dans les procédures sont présumés constituer. Seules les décisions de justice établiront la qualification définitive, quelques mois et parfois plus d’une année après la commission des faits. Or, il ne saurait être question d’attendre les jugements pour apprécier l’état de la criminalité, de la délinquance et de ses évolutions.

Effet paillasson : Une fois les variables créées, il est dit explicitement que, par manque de temps, il n’est pas possible d’attendre une désignation définitive des faits, ce qui rajoute un biais. Comment, en effet, s’assurer que la qualification des faits par un agent de police est celle qui sera retenue par la suite ? D’autant plus que l’agent n’est pas un observateur neutre, la qualification des faits pouvant influencer sa propre évaluation par ses supérieurs ; il est alors envisageable que cela puisse modifier, même de manière involontaire, son évaluation de la situation. Par ailleurs, rien n’assure que la personne poursuivie pour ce crime ou ce délit sera jugée coupable.


Conclusion

Tris sélectifs et invocation de l’opinion publique voire pour définir ce qui constitue un acte de délinquance, non indépendance des variables « nombre de délinquants » et « nombre d’agents luttant contre la délinquance », relevé des données biaisé : ces chiffres sont à utiliser avec de nombreuses précautions.


2ème partie : quelles statistiques sur le contrôle d’identité

Propos de B. Murat :

« Quand on est contrôlé 17 fois par jour »

ou

  • Quelles sources disponibles ? Quelle méthodologie ? Quels résultats ?
  • Quelles conséquences d’une mauvaise utilisation des chiffres ?

D’où vient le chiffre 17 ?

Comme B. Murat ne cite pas ses sources, on peut émettre différentes hypothèses : il connaît quelqu’un qui connaît quelqu’un (Ami d’un ami) et l’information mériterait d’être vérifiée ; ou il utilise une exagération pour mettre en relief son propos (effet impact d’une hyperbole) ; ou il a lu une étude sur le sujet ; ou il propage une idée commune mais non vérifiée. Je n’ai trouvé trace d’aucune étude énonçant ces chiffres, mais il existe une étude sur le sujet, menée en 2009 par deux membres du CESDIP – laboratoire de recherche du CNRS mais également service d’études du ministère de la Justice – F. Jobard et R. Lévy , intitulée Police et minorité visible : les contrôles d’identité à Paris.
Je n’en ai pas trouvé d’autres. Il est d’ailleurs dit p. 9 du rapport : Cette étude, qui présente des données uniques sur plus de 500 contrôles de police, est la seule menée à ce jour, propre à détecter le contrôle à faciès en France.

Quelle méthodologie et quelles notions pour établir des satistiques sur les contrôle au faciès ?

F. Jobard explique la méthodologie employée :

{avi}CorteX_Delinquance1_Jobard_Methodologie_controle_identite{/avi}

Les notions de surreprésentation et d’odds-ratio :
Que signifie la phrase « Telle catégorie est plus contrôlée que telle autre » ? Comment le mesurer ?
Quand on parle de surreprésentation, il faut faire attention à ne pas détacher des données importantes ; par exemple, si 10 Noirs et 5 Blancs ont été contrôlés, on ne peut pas affirmer pour autant que les Noirs sont 2 fois plus contrôlés que les Blancs. En effet, si les contrôles se font dans un lieu où se trouvent deux fois plus de Noirs que de Blancs, la population Noire contrôlée n’est pas surrepésentée dans la population contrôlée.

CorteX_Chiffres_de_la_delinquance_Diagrammes_Surrepresentation


Dans la première population imaginée, nous avons :
– 1 000 Noirs ou Arabes (bleu)
– 500 Blancs (orange)
– 10 trafiquants Noirs ou Arabes (bleu)
– 2 trafiquants Blancs (orange)

Les Noirs et les Arabes sont surreprésentés.

Dans la deuxième population imaginée, nous avons :
– 1 000 Noirs ou Arabes (bleu)
– 500 Blancs (orange)
– 10 trafiquants Noirs ou Arabes (bleu)
– 5 trafiquants Blancs (orange)

Les Noirs et les Arabes ne sont pas surreprésentés.

Il faut donc impérativement connaître la composition de la population globale du lieu d’observation avant de conclure à la surreprésentation et utiliser un outil statistique qui en rende compte, par exemple le odds-ratio dont vous pourrez trouver une définition sur wikipedia.

F. Jobard et R. Lévy nous expliquent comment l’interpréter :

L’odds-ratio compare entre elles les probabilités respectives de contrôle des différents groupes Les odds-ratios présentés dans ce rapport ont tous comparé les groupes relevant des minorités visibles à la population blanche, de sorte que l’odds-ratio se lit de la manière suivante : « Si vous êtes Noir (ou Arabe, etc.), vous avez proportionnellement x fois plus de probabilités d’être contrôlé par la police que si vous étiez Blanc ». L’odds-ratio est reconnu comme la meilleure représentation statistique de la probabilité affectant différents groupes d’une même population compte tenu de la composition de cette population.
L’absence de contrôle au faciès correspond à un odds-ratio de 1,0 : les non-Blancs n’ont pas plus de probabilité d’être contrôlés que les Blancs. Les odds-ratios allant de 1,0 à 1,5 sont considérés comme bénins, ceux allant de 1,5 à 2,0 comme le signe d’un traitement différencié probable. Les ratios supérieurs à 2,0 indiquent qu’il existe un ciblage des minorités par les contrôles de police.

Quels sont les résultats de l’étude ?

  1. Sur l’ensemble des 5 lieux d’observation, les Noirs (resp. les Arabes) ont entre 3,3 et 11,5 fois (resp. entre 1,8 et 14,8) plus de chances d’être contrôlés que les blancs. Le contrôle « au faciès » est donc avéré.
  2. Cependant, d’autres variables sont importantes, en particulier la tenue vestimentaire. Comme il l’est précisé dans le résumé de l’étude p. 10.
    Il ressort de notre étude que l’apparence vestimentaire des jeunes est aussi prédictive du contrôle d’identité que l’apparence raciale. L’étude montre une forte relation entre le fait d’être contrôlé par la police, l’origine apparente de la personne contrôlée et le style de vêtements portés : deux tiers des individus habillés « jeunes » relèvent de minorités visibles. Aussi, il est probable que les policiers considèrent le fait d’appartenir à une minorité visible et de porter des vêtements typiquement jeunes comme étroitement liés à une propension à commettre des infractions ou des crimes, appelant ainsi un contrôle d’identité.
    Il est important de noter que plusieurs corrélations – entre « être Noir ou Arabe », « être habillé jeune » et « être contrôlé »- sont établies. La relation de causalité « être Noir ou Arabe » implique « être contrôlé » mérite donc d’être discutée. En effet, si nous exagérons les faits et que nous supposons que tous les Noirs et Arabes et seuls les Noirs et les Arabes s’habillent jeunes, on ne saurait pas si le critère du contrôle est « être Noir ou Arabe » ou « être habillé jeune ».
    En réalité, la force prédictive de ces deux variables est à peu près équivalente.[…]En tout état de cause, même si l’apparence vestimentaire était la variable-clé de la décision policière, cela aurait un impact énorme sur les minorités visibles, dans la mesure où leurs membres sont plus susceptibles que les Blancs d’arborer une tenue « jeune ». En effet, deux tiers des personnes en tenue « jeune » appartiennent également à une minorité non-Blanche. Si l’on considère les trois groupes principaux, seulement 5,7% des Blancs de la population de référence portent une tenue « jeune », contre 19% des Noirs et 12,8% des Arabes. En d’autres termes, on peut dire de la variable « tenue jeune » qu’elle est une variable racialisée : lorsque la police cible ce type de tenues, il en résulte une surreprésentation des minorités visibles, en particulier des Noirs, parmi les contrôlés.
  3. Sur la fréquence des contrôles (attention, ces chiffres sont basés sur la déclaration des personnes contrôlées et n’ont pas été établis de manière rigoureuse).
    À la question de savoir si c’était la première fois qu’elles étaient contrôlées, une grande majorité de personnes interrogées (82%) a répondu par la négative. 38% ont indiqué être contrôlées souvent, 25% ont indiqué avoir été contrôlées de deux à quatre fois par mois, et 16% ont indiqué être contrôlées plus de cinq fois par mois. Il faut remarquer que l’éventail du nombre de contrôles dans cette dernière catégorie était étendu, les personnes indiquant avoir été contrôlées entre cinq et neuf fois le mois précédent, jusqu’à un total de 20 fois.

Quelles conséquences des approximations contenues dans les propos de B. Murat ?

Il est probable que B. Murat ait gonflé ce chiffre pour appuyer son discours, et qu’il ne pensait pas vraiment que le fait de contrôler les mêmes personnes 17 fois par jour est une pratique courante dans les banlieues.

Cependant, n’oublions pas que B. Murat pour répond à l’argument : « Il y a de la délinquance dans les banlieues ». On peut alors penser qu’il sous-entend qu’une des causes de cette délinquance est la répétition des contrôles. Si cela semble plausible pour, par exemple, ce qui concerne le délit d’outrage à agents – plus on est contrôlé, plus le nombre d’occasions « d’outrager » un agent de police est élevé – je ne connais pas d’étude qui démontrerait cette relation de cause-conséquence dans le cadre général. Ceci est probablement un effet cigogne.

En revanche, ce que tend à montrer la partie qualitative du rapport de F. Jobard et R. Lévy, c’est que le contrôle d’identité est perçu comme une agression par les personnes qui en sont les cibles, même si la plupart du temps et selon l’avis même des personnes contrôlées, le contrôle est mené sans agressivité de la part des agents.

Malgré le caractère généralement neutre ou positif des jugements sur le comportement de la police, ces contrôles ont suscité des sentiments très négatifs. Quelques personnes ont simplement déclaré que la police ne faisait que son travail et que le contrôle ne les avait pas dérangées. Mais près de la moitié des personnes interrogées ont indiqué être agacées ou en colère du fait du contrôle.[…] Le préjudice que les pratiques de contrôle de police causent à la relation que la police entretient avec les personnes objet de contrôle est manifeste.

Cette pratique est ressentie comme violente et humiliante par ceux qui la vivent donc la question de son efficacité mérite d’être posée. Je précise ma pensée : si le but de la politique est de minimiser la souffrance globale de la population et si le contrôle est vécu comme violent, il me semble tout de même nécessaire de s’assurer du fait que cette pratique est indispensable pour lutter contre une autre violence, celle dite « de la délinquance ». Savoir si cette condition est suffisante pour légitimer le contrôle d’identité est encore une autre question.


Partie 3 : quelles statistiques ethniques de la délinquance ?

Propos d’E. Zemmour :

« La plupart des trafiquants sont noirs et arabes. »

Quelles variables aléatoires ? Quelles sources ? Quelles conclusions ?

Trame du raisonnement :
a. La plupart des trafiquants sont noirs et arabes
+ b. Le contrôle d’identité permet d’attraper les trafiquants
=> c. En contrôlant plus les noirs et les arabes, on attrapera plus de trafiquants,

Pour tester la validité de la prémisse a, notons que la phrase La plupart des trafiquants sont Noirs et Arabes est une affirmation statistique, mal énoncée certes, mais relevant de la statistique tout de même. E Zemmour sous-entend donc que ces satistiques existent et que quelqu’un a dénombré tous les trafiquants (T), puis les trafiquants Arabes (Ta) ou Noirs (Tn) et a calculé le rapport (Ta+Tn)/T et a trouvé ainsi une probabilité supérieure à 0,5.

Quelles variables statistiques dans la prémisse (a) ?

Le « nombre de trafiquants » est une mauvaise variable statistique. On ne sait même pas de quel trafic on parle : de voitures, de drogue, de subprimes, d’armes, de sous-marins, de cigarettes, d’organes, de diamants, d’oeuvres d’art… ?
On peut supposer qu’E. Zemmour pense au trafic de drogue. Soit. Mais de quelle drogue ?
Comment peut-on compter les trafiquants ? Ceux qu’on a attrapés ? Ceux qui détenaient beaucoup de drogue ? Un peu ? Sont-ils représentatifs de la population des trafiquants ? Considère-t-on qu’on est trafiquant dès lors qu’on a « trafiqué » une fois ?
Une variable statistique pertinente – dans le sens : que l’on peut dénombrer convenablement – serait, par exemple, le « nombre de personnes condamnées pour détention de cannabis ». Une phrase qui aurait un sens statistique serait : « Il y a plus de Noirs et d’Arabes parmi les personnes condamnées au moins une fois dans les 5 dernières années pour une infraction sur les drogues ». Cette phrase a un sens; elle peut être vraie ou fausse.

« Etre Noir » ou « être Arabe » ou « être Blanc » sont également de mauvaises variables statistiques. Quand commence-t-on ou arrête-t-on d’être Noir, Arabe ou Blanc ? Quand un des parents l’est ? Ou bien les deux ? Ou une grand-mère suffirait ? Pour « trancher » la question, certains pensent même à utiliser la consonance du nom de famille, comme cela a déjà été fait dans un article du Point :

Le Point a pu consulter ces notes, dans lesquelles il apparaît que plus de la moitié, voire 60 ou 70%, des suspects répertoriés ont des noms à consonance étrangère. Cet élément est délicat à manipuler. En aucun cas l’on ne saurait déduire avec certitude une origine d’un patronyme. Il ne s’agit pas non plus de tirer des conclusions absurdes sur un caractère « culturel » de la criminalité. Mais écarter ces constatations d’un revers de manche est une grave erreur qui occulte l’échec de l’intégration.

On remarquera que la gravité de la conclusion, occulter l’échec de l’intégration, méritait pourtant qu’on s’assure de la qualité des prémisses du raisonnement.

Quelles sources pour les statistiques ethniques ou raciales dans la prémisse (a) ?

Si le fait d’établir des statistiques ethniques est en général illégal, certaines dérogations sont accordées par la CNIL. Par exemple, elle peut autoriser sous certaines conditions la collecte d’informations sur le pays d’origine des individus ou de leurs parents (on pourra aller consulter les 10 recommandations de la CNIL ). Comme le rapporte un article du Monde du 05/02/2010 :

De fait, si la loi Informatique et liberté de 1978 énonce une interdiction de principe sur le traitement statistique des données sensibles, elle permet d’y déroger, sous contrôle de la Commission nationale informatique et libertés (CNIL) et à condition de respecter certains critères (consentement individuel, anonymat, intérêt général…).

Notons toutefois qu’il n’existe pas de statistiques sur des « variables » du type Blancs, Arabes et Noirs, à une exception près, exception de taille : à mon grand étonnement je l’avoue, il existe un fichier confidentiel, nommé Fichier Canonge, qui classe les « délinquants » par « type » physique. Voici ce qu’en dit l’Express du 07/02/2006 :

A quoi ressemblent les délinquants de tous les jours? Pour le savoir, il suffit de se plonger dans un fichier méconnu, baptisé «Canonge», qui comporte l’état civil, la photo et la description physique très détaillée des personnes «signalisées» lors de leur placement en garde à vue. Grâce à cette base de données présentée à la victime, celle-ci peut espérer identifier son agresseur. Or ce logiciel, réactualisé en 2003, retient aujourd’hui 12 «types» ethniques: blanc-caucasien, méditerranéen, gitan, moyen-oriental, nord-africain-maghrébin, asiatique-eurasien, amérindien, indien, métis-mulâtre, noir, polynésien, mélanésien.

Cet outil est à manier avec prudence. D’abord, parce que, même si le Canonge est légal, la Commission nationale de l’informatique et des libertés (Cnil) interdit d’exploiter ses renseignements à d’autres fins que celle de la recherche d’un auteur présumé. Ensuite, parce qu’il ne dit rien de la nationalité et de l’origine de l’individu – qui peut être français depuis plusieurs générations malgré un physique méditerranéen, par exemple. Enfin, parce que les mentions sont portées par l’officier de police, avec la part de subjectivité que cela suppose.

Remarque : les mêmes précautions sont à prendre qu’avec les chiffres du rapport Criminalité et délinquance constatées en France (tris sélectifs de données, prédicion auto-réalisatrice, subjectivité des observateurs…)

Quelle population de référence pour établir la surreprésentation dans la prémisse (a) ?

Quand E. Zemmour prétend que la plupart des trafiquants sont Noirs ou Arabes, il énonce un résultat de surreprésentation : les Noirs ou les Arabes sont surreprésentés dans la population des trafiquants. Mais cela ne vous a pas échappé : cette notion n’a de sens que si l’on connaît la population de référence. Il est probable qu’E. Zemmour considère la population résidant en France, mais cela n’a pas vraiment de sens, puisque toutes ces personnes ne vivent pas forcément dans des conditions externes égales. Pour savoir si les Noirs ou les Arabes sont surreprésentés, il me semblerait préférable de considérer la population « susceptible d’être délinquante » (si tant est qu’on puisse donner un sens rigoureux à cette expression), c’est-à-dire celle qui vit dans les mêmes conditions que les « délinquants ».

Quelle probabilité conditionnelle dans l’implication (a)+(b) => c ?

Les prémisses (a) et (b) n’entraînent pas (c). Nous avons là un bel exemple de sophisme Non sequitur, dû à une erreur d’inversion de probabilité conditionnelle.
On retrouve le même sophisme dans les phrases suivantes, où il est plus facile à repérer

La plupart des pédophiles sont Blancs donc il faut plus contrôler les Blancs.
OU
La plupart des inculpés français dans l’affaire des frégates de Taïwan sont Blancs donc il faut plus contrôler les Blancs.
OU
Tous les incestes sont commis par un membre de la famille donc il faut contrôler tous les membres de sa famille

En fait, E. Zemmour s’emmèle les probabilités conditionnelles.

Ce n’est pas parce que la proportion de Noirs et d’Arabes est importante dans la population des trafiquants – dans ce cas on considère P(N U A/T) – que la proportion de trafiquants est importante dans la population Noire et Arabe – ici on regarde P(T/N U A). Vous en serez encore plus convaincu si vous prenez les autres versions du sophisme.

Exemple :
Imaginons une population composée de 1 000 personnes, dont :
– 400 Noirs ou Arabes
– 600 Blancs
– 7 trafiquants : 5 Noirs ou Arabes et 2 Blancs
Dans cet exemple,
P(NUA / T) = Nombre de Trafiquants Noirs ou Arabes / Nombre de Trafiquants ≈ 71,4%
P(T / NUA) = Nombre de Trafiquants Noirs ou Arabes / Nombre de Noirs ou Arabes ≈ 1,2%
Les ordres de grandeur sont radicalement différents.

Notons qu’E. Zemmour revient sur ce point dans le Parisien et le rectifie. Cependant, quand il dit « Je dis juste qu’ils sont contrôlés plus souvent parce qu’il y a plus de délinquance parmi eux« , le parce que légitime la pratique du contrôle et sous-entend qu’on a des chances d’attraper des trafiquants de cette manière et donc que la probabilité P(T/A U N) est élevée ; sa prémisse de départ est, rappelons-le, que P(A U N/T) est élevée.

Quelles conséquences des approximations contenues dans les propos d’E. Zemmour ?

Ces propos sont très essentialistes même, encore une fois, si ce n’était pas l’intention de l’auteur. La phrase « La plupart des trafiquants sont Noirs ou Arabes » est très souvent entendue comme « Ils sont délinquants parce qu’ils sont Noirs ou Arabes » (effet cigogne), ce qui n’a aucun fondement scientifique et qui exacerbe le racisme.


Mais au fait, quelle est la probabilité d’attraper un trafiquant lors d’une journée de contrôles d’identité ?

Cette partie est conçue pour pousser votre public à se méfier des statistiques, y compris quand c’est vous qui les présentez. Je vous propose pour cela de faire de mauvaises statistiques sans en avoir l’air. Si un membre du public réagit, vous avez gagné la partie. S’il n’y a pas de réactions spontanées, cela vous donnera l’occasion de pointer du doigt
1. la nécessité d’être vigilant en permanence : même averti, on n’est pas à l’abri d’une entourloupe, volontaire ou non,
2. qu’il ne faut pas croire sur parole la personne qui essaie de vous transmettre des outils critiques.

Attention : Mauvaises statistiques ! Les chiffres obtenus dans ce qui suit ne représentent absolument rien.
– Dans l’article de l’Express sur le fichier Canonge, il est dit que sur 103 000 trafiquants fichés, il y a 29% de Nord-Africains et 19% de Noirs.
En tout, cela fait 49 440 trafiquants Noirs ou Arabes.

– On peut évaluer à environ 2 988 745 personnes Noires ou Arabes en France.

– La probabilité de tomber sur un délinquant en contrôlant un Noir ou un Arabe au hasard est donc à peu près de 49 440 / 2 988 745 ≈ 1,7%.

– F. Jobard et R. Lévy rapportent p. 62 que le nombre moyen de contrôles observés par heure est de 1,25. Ce qui fait 8,75 contrôles pour 7 heures travaillées. Disons 9 contrôles par jour.

– En remarquant que la variable aléatoire « nombre de trafiquants attrapés dans la journée » suit une loi binomiale, on obtient la conclusion suivante :
la probabilité d’attraper au moins un trafiquant dans la journée en contrôlant les Noirs et les Arabes est d’environ 14,2%. Sur 100 journées de contrôles d’identité, une équipe qui pratique les contrôles d’identité revient sans trafiquant 85 fois.

Vous venez de créer une occasion pour votre public d’analyser vos propos de manière critique :
Vous êtes-vous posé la question de savoir d’où sortait le chiffre du nombre de Noirs et Arabes en France ? Ce n’est en fait qu’une estimation, très mauvaise, faite avec les moyens du bord et très critiquable.
Je suis allée sur le site de l’INSEE où figurent des données – cliquer sur Données complémentaires, sur cette page et consulter le graphique 2 – sur le nombre de personnes entre 15 et 50 ans dont au moins un des parents est immigré de Turquie, d’Afrique Subsaharienne, du Maroc, de Tunisie ou d’Algérie : il y en a 1 282 000.
Par ailleurs, sur le site de l’INED, on peut télécharger le document Immigrés selon le sexe, l’âge et le pays de naissance 2007. Dans l’onglet France détail, on peut lire qu’il y a en France en 2007, 1 706 745 immigrés issus du continent Africain et qui ont entre 18 ans et 59 ans.

Ensuite, j’ai appliqué une grande dose de racisme ordinaire : ceux qui viennent (ou dont un parent vient) d’Europe sont blancs, ceux qui viennent du Maghreb sont Arabes et ceux qui viennent d’Afrique Noire sont Noirs. Les Antillais qui sont Français sont comptés comme Blancs, les Français dont les deux parents sont Français sont comptés comme Blancs etc…

Remarquez que, sur wikipedia (version du 19/01/2011), on peut lire

En 2010, la France accueille 6,7 millions d’immigrés (nés étrangers hors du territoire) soit 11% de la population. Elle se classe au sixième rang mondial, derrière les Etats-Unis (42,8 millions), la Russie (12,3), l’Allemagne (9,1), l’Arabie Saoudite (7,3), le Canada (7,2) mais elle devance en revanche le Royaume-uni (6,5) et l’Espagne (6,4). Les enfants d’immigrés, descendants directs d’un ou de deux immigrés, représentaient, en 2008, 6,5 millions de personnes, soit 11 % de la population également. Trois millions d’entre eux avaient leurs deux parents immigrés. Les immigrés sont principalement originaires de l’Union européenne (34 %), du Maghreb (30 %), d’Asie (14 %, dont le tiers de la Turquie) et d’Afrique subsaharienne (11 %).

En reprenant les calculs avec ces chiffres – à savoir 41% de 6,7 millions + 6,5 millions-, on obtient une probabilité d’attraper au moins un trafiquant en une journée de 8% environ. Encore faudrait-il savoir à quoi correspondent ces données exactement ? Les sources de l’article de wikipedia sont :

Les immigrés constituent 11% de la population française [archive], TF1, Alexandra Guillet, le 24 novembre 2010, source : Ined

Etre né en France d’un parent immigré [archive], Insee Première, N° 1287, mars 2010, Catherine Borel et Bertrand Lhommeau, Insee

Bref, le calcul est biaisé et il m’est impossible d’évaluer la marge d’erreur commise. Ce chiffre n’a aucune légitimité et ne pourra être brandi d’aucune manière sur un quelconque plateau télé ou lors d’un quelconque dîner de famille.
Mais il permet d’énoncer une conclusion : les chiffres ne parlent pas d’eux-mêmes. Il est important de savoir comment ils ont été élaboré.

Cours Esprit critique et mathématiques au lycée : (se) tromper avec les graphiques

Louis Paternault est enseignant de mathématiques au lycée Ella Fitzgerald de Saint Romain en Gal (69). Il nous présente ici une séquence effectuée avec ses élèves de seconde et première S concernant l’analyse des graphiques, en étudiant les différents biais qui peuvent se glisser dans leur réalisation et interprétation. Un travail précieux qui utilise des informations réelles, parues dans différents médias, renforçant l’idée que notre esprit critique gagne toujours à être en éveil face aux chiffres et autres présentations numériques dans la vie quotidienne. Merci et bravo à Louis !

L’article rédigé par Louis est déjà publié et mis en forme sur son blog, nous le reproduisons ici avec son autorisation.

Objectif principal

Cette activité de lycée a pour but d’étudier différentes manières permettant de tromper (volontairement ou non) avec des graphiques. En d’autres termes, comment la représentation de vraies données statistiques permet de donner une impression erronée ?

Téléchargement

Pour les personnes pressées, commençons par les documents nécessaires pour réaliser cette séance en classes :

(fichiers LaTeX et images ; à décompresser avec le logiciel libre 7zip si votre système d’exploitation ne sait pas quoi faire de ce fichier).

Contexte

Cette séquence a été réalisée en accompagnement personnalisé, en seconde et en première S. Je pense qu’elle peut-être réalisée à n’importe quel niveau du lycée général.
Elle a été effectuée en demi-groupes (17 élèves environ).

Objectifs de la séquence

En ce qui concerne le programme de mathématique, cette séquence permet de :

  • lire, analyser, créer différentes représentations de séries statistiques ;
  • « faire réfléchir les élèves sur des données réelles et variées » (programme de seconde) ;
  • manipuler le tableur (principalement pour représenter une série statistique).

Pour l’esprit critique, cette séquence permet :

  • de voir comment les mêmes données peuvent donner une impression différente selon la manière dont elles sont représentée ;
  • d’apprendre à ne pas se laisser tromper par de telles erreurs (volontaires ou non).

Déroulement

Cette séquence se déroule en deux parties (d’environ une séance chacune) : dans un premier temps, les élèves étudient des graphiques « réels » (publiés dans des journaux, à la télé, par des partis politiques, etc.) pour établir une liste d’erreurs fréquentes ; dans un second temps, ils sont amenés à créer eux-même un graphique trompeur (qui, à partir de vraies données, donne une impression fausse ou fantaisiste).

Première séance : Analyse de graphiques

Note : J’ai réalisé d’abord cette séance ; ma collègue Céline l’a utilisée et améliorée. C’est sa version que je décris ici.
La professeure commence par présenter oralement l’objectif de la séance :

À partir de données réelles : répertorier différentes manières de tromper les autres en construisant des graphiques (et donc, répertorier aussi des pièges à éviter pour ne pas se tromper en observant des graphiques).

Travail en groupe

Les élèves sont séparés en deux groupes, et doivent prendre un stylo chacun. Chaque groupe se voit distribuer :

  • les polycopiés groupeA.pdf pour le premier groupe, groupeB.pdf pour le second groupe (dans chacun des deux polycopiés, les mêmes données sont représentées de deux manières différentes, menant à des conclusions différentes) ;
  • des post-it.

Les élèves ont eu quelques minutes pour analyser chaque graphique et prendre des notes de leurs idées (une par post-it).

Mise en commun

La professeure leur présente la première partie du diaporama (qui reprend les graphiques qu’ils ont eus entre les mains), en leur disant qu’il s’agit des graphiques qu’ils ont analysés sur polycopié, et qu’ils vont répertorier aux tableaux chacune des « manipulations » possibles.
Leurs idées (d’erreurs ou manipulation) sont relevées au cours du diaporama, à partir de leurs post-it, et des nouvelles idées qui peuvent alors venir.
À la fin de cette partie, une liste des erreurs possibles est disponible au tableau (voir ci-dessous).

Nouveaux graphiques

La seconde partie du diaporama est alors projetée, et les élèvent doivent identifier pourquoi les graphiques proposés sont trompeurs, en se référant à la liste construite précédemment.

Seconde séance : Création d’un graphique trompeur

Note : Cette séance n’a pas été réalisée entièrement ; je pense qu’elle prend une ou deux séances d’une heure.
Cette séance se déroule sur tableur, par binôme. Le but de la séance est de créer un graphique trompeur (réalisé à partir de vraies données, mais qui donne une impression fausse ou fantaisiste).

Première partie

Les élèves ont à disposition l’énoncé, et des séries de données statistiques (réelles, mais a priori sans lien entre elles).
Ils doivent tracer différents graphiques (le détail est dans l’énoncé) ; le but est de leur faire manipuler le tableur (différents types de graphiques, plusieurs axes pour un même graphique, axes ne commençant pas à zéro, etc.).

Seconde partie

Après avoir vu comment manipuler des graphiques, c’est au tour des élèves de produire un graphique trompeur : ils doivent produire un graphique qui montre une corrélation entre deux des séries données pourtant sans lien entre elles.
Les données (population, nombre de mariages, dépenses en fruit et légume, entrées au cinéma en France depuis 1960) sont dans un fichier donnees.ods (sur lequel ils ont travaillé dans la partie précédente). Les élèves peuvent sélectionner les données représentées, supprimer celles qui ne servent pas leurs objectifs, mais ils n’ont pas le droit d’inventer ou modifier des données.

Troisième partie

Enfin, il est possible de terminer (je ne l’ai pas fait ; voir la partie Bilan) en faisant présenter aux élèves leurs corrélations bidon de manière aussi convaincante que possible : en les faisant trouver des fausses explications (« la consommation de légumes favorise les mariages car… ») ou des conséquences (« il faut encourager les français à aller au cinéma pour que la consommation de fruits et légumes augmente »).

Bilan

Analyse de graphiques

Les élèves ont semblé apprécier cette séance : ils ont été très dynamiques. Ils ont bien détecté les problèmes et ont fait des commentaires intéressants sur les différents thèmes. L’objectif de la séance (remarquer des erreurs dans les graphiques) semble donc atteint.

Création d’un graphique trompeur

Je n’ai réalisé que partiellement cette séance (j’ai commencé, mais les vacances sont arrivées, et des séances ont été annulées, et finalement, la suite se serait déroulée plus de six semaines après la première partie ; j’ai préféré abandonner) ; ma collègue ne l’a pas réalisée (à cause de la fin de l’année), donc le bilan est très partiel.
La création de graphiques (pas encore trompeurs) a plutôt fonctionné, en demandant leur attention régulièrement pour expliquer comment faire certains gestes techniques (calcul en base 100, deux axes différents, etc.). Comme alternative, je vois :

  • faire un sujet très dirigé (mais je voulais les laisser tâtonner, pour qu’ils apprennent à chercher) ;
  • distribuer un mémo sur l’utilisation des graphiques avec LibreOffice.

Seuls quelques binômes se sont essayés à la création de graphiques trompeurs, et seul l’un d’entre eux a été jusqu’au bout, et a réussi à montrer une relation entre deux séries a priori indépendantes. Les autres n’ont pas terminé par manque de temps.
Je pense qu’une séance d’une heure ne suffit pas à faire cette partie : deux séances devraient convenir. La dernière partie (présenter à la classe son graphique) peut servir de variable d’ajustement si les élèves ont terminé trop tôt.

Liste des erreurs

Les erreurs analysées dans cette séquence sont les suivantes :

  • Utiliser une échelle logarithmique au lieu d’une échelle linéaire (cela peut être parfois très utile, mais c’est trompeur si on ne fait pas bien attention).
  • Ne pas faire commencer l’axe des ordonnées à 0 (très courant).
  • Utiliser la 2D ou la 3D pour donner de fausses impressions (doubler l’échelle multiplie les aires par quatre, et les volumes par huit).
  • Trier les données : effacer celles qui ne nous plaisent pas (particulièrement efficace en sélectionnant la période de temps qui sert notre propos).
  • Choisir la bonne année de référence pour des indices en base 100 (ce qui est la raison d’être des indices, mais qui peut créer un effet exagéré par rapport à la réalité des données).

Exemples traités

Je donne pour chacun des exemples la question posée aux élèves, sur laquelle porte la manipulation ou l’erreur du graphique.

Évolution des salaires

Qui, des cadres ou des ouvriers, a vu son salaire annuel net moyen augmenter le plus entre 1992 et 2012 ?

Le graphique de droite utilise une échelle logarithmique, alors que celui de gauche utilise une échelle linéaire (à laquelle nous sommes le plus habitués). Ce que montrent ces graphiques, c’est que le salaire des cadres augmente le plus en valeur absolue (graphique de gauche), alors que c’est le salaire des ouvriers qui augmente le plus en taux d’évolution (graphique de droite).
Laquelle des deux réponses est la bonne ? C’est une question politique, pas mathématique.

Évolution du chômage

Le chômage a-t-il :

  • un peu, ou pas augmenté ?
  • moyennement augmenté ?
  • beaucoup augmenté ?

Ces trois graphiques présentent la même information (les mêmes données) de trois manières différentes.

  • Sur aucun des trois graphiques, l’échelle verticale ne commence à zéro (et sur celui de France 2, elle n’est même pas présente) : cela augmente artificiellement les évolutions.
  • La légende de l’axe horizontal est difficilement lisible.

Évolution du taux de grévistes

Le nombre de grévistes a-t-il :

  • peu diminué ?
  • beaucoup diminué ?
First slide
La légende a été effacée.
First slide
Version originale de la SNCF.
First slide
Version corrigée : les hauteurs des barres sont proportionnelles aux pourcentages.

D’après le communiqué de presse de la SNCF du 4 avril 2018 ; relevé par l’émission C’est à vous du 6 avril 2018 (France 5).

L’erreur ici est que l’échelle verticale ne commence pas à 0.
Il est intéressant de rappeler le contexte : ce communiqué a été publié durant une grève des cheminots contre la direction de la SNCF (et plus largement contre une mesure du gouvernement) ; la direction de la SNCF a tout intérêt à minimiser le succès de la grève, pour décourager les cheminots et rassurer les usagers.

Part de marché

Quelles sont (dans l’ordre) les trois premières marques de smartphones en fonction de leur part de marché ?

First slide
La légende a été effacée.
First slide
Version originale (avec légende).

La 3D donne l’impression que la section verte est plus grosse que la violette, mais c’est l’inverse qui est vrai.
D’une manière générale : ne jamais utiliser de 3D dans les graphiques : c’est joli, mais ça fausse très souvent les résultats.

Évolution de la fréquentation des cinémas

La démocratisation d’internet en France (à partir des années 2000) a-t-elle eu un effet négatif/neutre/positif sur la fréquentation des français au cinéma ?

Les personnes luttant contre le téléchargement illégal affirment souvent que le « piratage » tue le cinéma. Ces données le prouvent-elles ?
Si l’on regarde le premier graphique, qui ne présente que les données sur la période 2001—2007, on a l’impression que la fréquentation stagne, voire décroît. En revanche, en regardant les données depuis les années 50 (second graphique), on voit que la fréquentation a plutôt tendance à augmenter ces dernières années.
Ici, selon la période de temps présentée, on montre un effet ou son contraire.

Aires de disques

En regardant le premier graphique :

  • Le disque rose est « combien de fois » plus grand que le disque vert ?
  • Quel pourcentage représente-t-il ?
First slide
Sans la légende. Source : Le Monde, édition du 12 juin 2012.
First slide
Avec la légende. Source : Le Monde, édition du 12 juin 2012.

Source : Le Monde, édition du 12 juin 2012.

Les rayons des cercles sont proportionnels aux pourcentages, mais les aires donnent du coup une impression faussée. Si les rayons des cercles rose et vert sont proportionnels aux pourcentage (environ six fois plus grand), les aires ne le sont pas : l’aire du disque rose est 36 fois celle du disque vert.
Il y a deux problèmes ici.

  • D’une part, sur un graphique en deux dimensions (comme ici) ou en trois dimensions, une multiplication de l’échelle par deux produit une multiplication de l’aire par 4, et du volume par 8, ce qui est trompeur (attention donc aux graphiques qui, par exemple, pour représenter l’évolution des dépenses de santé, représentent un hôpital plus ou moins gros : est-ce que l’échelle est proportionnelle aux données, ou le volume ?).
  • D’autre part, l’œil et le cerveau humains savent bien comparer des distances (hauteur ou longueur), mais ne sont pas bons pour comparer des aires (cité par Vandy Berten dans la partie Confondre surface et taille de son article Comment mentir avec un graphique).

Conclusion : Ne pas utiliser de 2D ou 3D (ou alors faire très attention).

Radicalisation en France

Voir la version sans légende sur laquelle travailler en classe.

  • Classer les couleurs par nombre de cas signalés.
  • Quelle est la particularité des départements noirs ?
_primary

 

Source : Journal du dimanche, d’après des données du ministère de l’Intérieur ; repéré par Le Monde (22 mai 2018).

Deux erreurs faussent cette cartographie :

  • Le choix des couleurs n’est pas usuel. Le plus souvent, pour montrer une gradation de données, les couleurs utilisées vont du plus clair au plus foncé (exemple), ou suivent plus ou moins le spectre lumineux (exemple). Sur cette carte, comparer deux départements sans se référer à la légende n’est pas évident.
  • Les données représentées sont des données brutes, et non pas relatives. Ce graphique montre que dans les départements les plus peuplés sont relevés le plus grand nombre de cas de radicalisation, ce qui est tout à fait normal si le taux de radicalisation est indépendant de la géographie (voir une présentation humoristique de ce problème).

Tract électoral

Quel procédé a été utilisé pour renforcer l’argument de ce tract électoral ?

_primary

 

Source : Parti Socialiste, repéré par Vandy Berten.

L’échelle verticale ne commence pas à 0.

Chiffres de la délinquance

En quoi l’utilisation du graphique par Brice Hortefeux (alors ministre de l’intérieur, donc en charge de la délinquance) est-elle fallacieuse ?

Source : Journal télévisé du 20 janvier 2011, TF1 (repéré par le Cortecs).

  • Un premier problème classique est que l’échelle verticale est absente. Il est assez facile d’observer qu’elle ne commence pas à zéro.
  • Le titre est particulièrement vague : Qu’est-ce qui est mesuré ici ? La délinquance réelle ? Le nombre de plaintes ? On a vu des policiers jouer avec les chiffres (faire déposer une plainte par personne à un groupe de personnes pour augmenter ces chiffres ; requalifier une tentative de cambriolage en destruction de biens pour transformer un crime en délit). Les violences interpersonnelles (violences conjugales par exemple) semblent augmenter, mais c’est plutôt dû au fait que les victimes portent maintenant plus souvent plainte (pour une analyse plus approfondie, voir cet article écrit en réaction à ces annonces de Brice Hortefeux). Le nombre de plaintes n’est donc pas un bon indicateur de la délinquance.Est-ce la délinquance ressentie qui est mesurée ? Celle-ci augmente plutôt, alors que le monde n’a jamais été aussi peu violent.Bref, avec assez peu de rigeur (ou beaucoup de mauvaise foi), il est possible de faire dire à peu près n’importe quoi aux chiffres de la délinquance.

Production industrielle

Pouvez-vous classer les quatre pays représentés en fonction de leur production industrielle en 2015 ?

Source : Débat télévisé du 20 mars 2017 (durant la campagne pour l’élection présidentielle). Marine Le Pen a publié ce graphique sur son compte Twitter.

Ce classement n’est pas celui représenté sur le graphique qui représente des indices, base 100 en 2001 (année d’introduction de l’euro). En choisissant une autre année de référence, on obtient des graphiques dans lesquels l’effet annoncé par Marine Le Pen, s’il est toujours présent, est beaucoup moins impressionnant.
Les « décodeurs » du Monde font une analyse détaillée de ce graphique.

Corrélation n’est pas causalité 1

Quel est le lien entre le nombre de magasin Ikéa dans chaque pays, et son nombre de prix Nobel ?

_primary

 

Sources : Wikipédia pour le nombre de magasins Ikea par pays ; La Croix pour le nombre de prix Nobel par pays.

Commençons par remarquer que j’ai supprimé de ce graphique les données qui ne servaient pas mon propos (comme la Chine, qui a beaucoup de prix Nobel, mais peu de magasin Ikéa).
Une règle bien connue des zététiciens est « Corrélation n’est pas causalité ». Il est probable que le nombre de magasins Ikéa dans un pays soit corrélé au nombre de prix Nobel, mais ce n’est pas pour autant que l’un est la cause de l’autre. Dans ce cas, il y a sans doute un troisième facteur qui est la cause de cette corrélation : le niveau de vie. Plus le niveau de vie d’un pays est élevé, plus il y aura de magasin Ikéa et de prix Nobel.
Un autre exemple célèbre est que dans les écoles, la taille des pieds (la pointure) est corrélée au niveau de lecture : en général, les élèves qui ont les plus grands pieds savent mieux lire que les autres. Bien qu’étrange à première vue, ce lien est parfaitement normal : les élèves plus agés ont des pieds plus grands, et savent mieux lire.
Conclusion : Ce n’est pas parce que deux mesures sont liées que l’une est la cause de l’autre.

Corrélation n’est pas causalité 2

Quel est le lien entre le nombre de divorces dans le Maine (un état américain) et la consommation de margarine (aux États-Unis ?) ?

_primary

 

Source : Tyler Vigen, Spurious Correlation.

Encore une fois, corrélation n’est pas causalité. Mais cette fois-ci, contrairement à l’exemple précédent, il n’y a sans doute pas de liens entre les deux séries de données : ce n’est probablement qu’un hasard.
Les zététiciens disent également que « L’improbable est probable ». S’il est quasiment impossible que deux séries statistiques prises au hasard soient corrélées, il est tout à fait normal que, parmi les milliards de séries statistiques qui existent dans le monde, plusieurs séries sans lien entre elles varient de la même manière. C’est ce qui se passe ici.

Variations et Valeurs cumulatives

Je n’ai pas utilisé cet exemple avec mes élèves, mais en utilisant les valeurs cumulatives plutôt que les valeurs absolues, il est possible de donner une impression fausse. Vandy Berten donne un exemple dans Comment mentir avec un graphique.

Bibliographie

J’ai puisé mes exemples de graphiques trompeurs dans les articles suivants (mais pas uniquement).

Le CORTECS se transforme en pôle emploi – poste à l'ENIB Brest

CorteX_pole-emploi-logoIl y a deux ans, nous avons eu le plaisir, en intervenant à l’École Nationale d’Ingénieurs de Brest, de découvrir le travail critique développé par notre amie Delphine Toquet. Férue de zététique, spécialiste de Francis Bacon, elle cherche un·e partenaire d’enseignement « critique », et nous demande de relayer son offre. C’est chose faite.

Théoriquement, le corps est « Agrégé », mais un CAPES fait l’affaire. La spécialité indiquée est Lettres Modernes, parce qu’il fallait bien indiquer quelque-chose, mais la discipline de départ ne semble pas être un frein. Pour toute autre question, contactez Mme TOQUET Delphine, professeur de lettres : delphine.toquet@enib.fr

Fiche de poste :

Ce  professeur  assurera  l’enseignement  des  « Sciences  Humaines  pour  l’Ingénieur »  auprès d’un public de 1ère, 2nde  et 3ème  années de  l’ENIB (semestre 1 à 6) ; et  accompagnera les étudiants sur des projets d’engagement social (Projet « Ingénieur Honnête Homme »). 

Sa pédagogie spécifique – théorique et pratique – conduira les étudiants à progresser dans la maîtrise  de leur expression, écrite et orale, et, d’une façon élargie, à prendre conscience et perfectionner  leurs  modes  de  communication  avec  leur  environnement  social  et institutionnel, contemporain.

 Pour  ce  faire,  il  pourra  puiser  dans  de  larges  ressources  et  pratiques  culturelles  où  les sciences humaines ainsi que les faits de langue et d’écriture (production de textes personnels, articles,  résumés,  synthèses,  etc.)  tiennent  une  place  déterminante :  linguistique, anthropologie,  philosophie,  ethnologie,  sociologie, psychosociologie,  esthétique,  etc.,  à l’œuvre dans le monde du travail et de l’entreprise, pourront fournir leur éclairage. Il aura à sa disposition les offres nombreuses que lui propose l’actualité, dans toute sa diversité et celles d’un  centre  de  documentation  actif  et  très  au  fait  des  problématiques actuelles (documentation d’actualité, films, documentaires, ouvrages spécialisés, etc.).

Par son charisme, sa culture, sa connaissance des divers mouvements de pensée et de leur histoire, il animera un cours selon une pédagogie vivante qui saura captiver des étudiants engagés dans un cursus scientifique et technique, et les introduira aux enjeux contemporains,  conformément à l’impératif d’ouverture d’esprit  qui doit être le leur.

 

Book-e-book, nouveau site pour bouquins critiques

CORTECS_logo_b-e-bookLes ressources critiques, zététiques, sceptiques ou peu importe leur nom n’ont que très peu de place sur le marché cognitif. Il existe pourtant un petit éditeur, Book-e-book qui tant bien que vaille résiste, et fait peau neuve. En achetant leurs livres, on fait d’une pierre trois coups : on diffuse une information rare, on apprend des choses et on soutient l’édition alternative. Que demande le lecteur ?

Le nouveau site de Book-e-Book est ouvert avec accès à la commande pour les livres en version papier et également pour les livres en version numérique pdf.
 

Le CORTECS a déjà publié trois ouvrages chez cet éditeur.

  • R. Monvoisin, Les fleurs de Bach. Enquête au pays des élixirs (ici).
  • Collectif, Esprit critique es-tu là ? ().
  • R. Monvoisin, Quantox – Mésusages idéologiques de la mécanique quantique (ici).
Bien d’autres collaborateurs y ont également produit de bons ouvrages : H. Broch, J-J. Aulas, J. Brissonnet, etc.
Nous vous encourageons à commander ces livres en ligne, ou à les faire commander par vos petites librairies locales : vu que la publication se réduit d’autant plus que les éditions sont possédées par de grands consortiums, il est recommandable d’éviter les grandes centrales d’achat type FNAC, qui elles, minimisent l’offre – ou placent nos bouquins à côté de ceux des frères Bogdanoff.
 
 

Matériel audio sur des pseudosciences

Voici au gré de nos écoutes des émissions traitant de pseudosciences qui peuvent fournir des bases de réflexion et d’élaboration de contenu pédagogique. Si vous vous en servez, racontez-nous.

Table des matières

Phrénologie

CorteX_crane_phrenologiePhrénologie

Émission de la Marche des sciences, sur France Culture : « De la bosse des maths à la théorie du criminel né : l’histoire de la phrénologie » diffusée le 25 décembre 2014.

L’histoire de la phrénologie est des plus étonnantes et des plus rocambolesques pour qui sait, aujourd’hui, comment fonctionne le cerveau. Mais au 18e siècle, des hommes comme François-Joseph Gall, fondateur de la théorie de la phrénologie, Pierre-Marie Alexandre Dumoutier ou encore Johann Gaspard Spurzheim, ont réussi à la promouvoir et à la populariser dans une société qui a cru en cette pseudoscience et qui la rendue célèbre dans les salons de l’époque.
Que nous a apporté la phrénologie en matière de connaissance du cerveau ? Quelles techniques scientifiques a t-on mis en place pour asseoir cette discipline ? Quel héritage en reste t-il ? Pour répondre à ces questions, nous avons choisi de nous immerger dans les réserves du Musée de l’Homme où moulages et crânes de cette époque sont précieusement conservés, nous y avons convié deux invités, Marc Renneville, chercheur au CNRS au centre Alexandre Koyré, directeur de publication de la plateforme Criminocorpus et auteur entre autre du livre Le langage des crânes paru aux Empêcheurs de penser en rond, et Philippe Mennecier directeur de collections au Museum national d’histoire naturelle de Paris.  

 

Ecouter

Télécharger (37Mo)

Le CORTECS dans le Monde, 11 février 2015

Le CORTECS a fait l’objet d’un article d’A. de Tricornot, du Monde. Même si nous avons pu mesurer l’impact positif de ce type d’article, ne serait-ce que sur nos collègues, il nous semble nécessaire d’expliquer en quoi les lignes ci-dessous nous ont laissés perplexes. Voici donc l’article tel quel (et sa version pdf). Nous prendrons ensuite le temps de vous narrer le off, et les mécanismes sous-jacents à l’élaboration d’un tel article. Frissons garantis !

L’université de Grenoble réhabilite l’art du doute

Pour former l’esprit critique des étudiants, l’université Joseph-Fourier (UJF), à Grenoble, a dû pousser les murs. Son cours de « Zététique & autodéfense intellectuelle »– le premier terme désignant l’art de douter – a déménagé dans l’amphithéâtre Weil au cours du premier semestre, le plus grand avec ses 900 places. Et il s’est ouvert à l’ensemble des étudiants de licence 1 et 2 des universités Grenoble-Alpes (Joseph-Fourier, Stendhal, Pierre-Mendès-France), ainsi que ceux de Sciences Po Grenoble.

Au menu : décortiquer les thérapies bidon, les « pseudo-sciences » – y compris politiques –, le paranormal, les mécanismes de l’illusion, les manipulations en tout genre – des médiatiques aux sectaires –, la propagande… Ou du moins en donner des clés. Certains étudiants ont choisi cette « unité d’enseignement transversal » dans leur cursus, d’autres assistent en auditeurs libres à ce cours-événement. Les ressources pédagogiques sont aussi mises à disposition librement en ligne.

De plus en plus d’étudiants recherchent en effet ce regard critique. « On complexifie cette envie, on l’outille, on leur fait se méfier du goût assez intuitif des complots et on les entraîne à la recherche rationnelle d’informations », explique Richard Monvoisin, qui enseigne depuis dix ans la zététique. Premier docteur en didactique des sciences sur le sujet de la zététique en 2007, il est un des piliers du Collectif de recherche transdisciplinaire esprit critique et sciences (Cortecs), dont les cours essaiment avec Clara Egger, à Sciences Po Grenoble, et au-delà avec Denis Caroti, à Marseille, ou Guillemette Reviron, à Montpellier.

Depuis septembre 2012, Richard Monvoisin occupe un poste unique dans l’université française : chargé de mission « Sciences, critique & sociétés » auprès du président de l’UJF. « Patrick Lévy et nous nous battons pour monter une jeune équipe spécifique “esprit critique” », explique M. Monvoisin. « Nous sommes sur un site de fort développement technologique : tout ce qui peut donner un peu d’esprit critique à tous les champs disciplinaires est bienvenu », explique le président de l’UJF, qui souligne aussi l’intérêt « d’une démarche citoyenne qui a énormément de succès auprès des étudiants ».

« Saturation »

Depuis les attentats de Paris des 7, 8 et 9 janvier, les cours de M. Monvoisin n’ont pas encore repris. « J’ose espérer que les étudiants ont appliqué un de nos préceptes : ne pas se laisser aller dans le battage médiatique, et attendre que les choses se redéposent, comme le limon, pour traiter les choses rationnellement et non affectivement », dit-il. Qu’en ont-ils retenu, justement ?

Benoît Arnould, vice-président étudiant de l’UJF, se souvient d’avoir appris « comment détecter les techniques de manipulation les plus courantes et l’impact qu’elles ont eu. Par exemple, la façon de poser des questions dans un sondage téléphonique et le résultat sur les réponses. Ou, dans les médias, le rôle de l’omniprésence de l’information. Cela fonctionne beaucoup dans les périodes où aucun autre événement ne parvient à percer ». Une forme de « saturation » et « d’objet unique » sur les écrans offre alors des éléments très nombreux, partiels ou non vérifiés « sur lesquels peuvent s’appuyer des théories du complot, dont les formes les plus courantes nous avaient été présentées en cours », se rappelle l’étudiant, aujourd’hui en troisième année de chimie-biologie.

« Ce qui m’a fait réagir, c’est toutes les informations données au conditionnel dans les médias, abonde Astor Bizard, étudiant en deuxième année de mathématiques et informatique. Je me suis dit : quand il y aura une certitude, peut-être que je pourrai y accorder crédit. Car le doute ne conduit pas au complotisme. Il pousse à réfléchir. Si les sources sont fiables et vérifiables, il n’y a aucune raison de douter de ce que dit un média. » Benjamin Roelandt, étudiant en deuxième année de licence d’informatique, note, lui, que le processus de radicalisation des auteurs des attentats « faisait penser au principe des sectes : ils croisent les mauvaises personnes au mauvais moment, lors d’un choc psychologique : par exemple, ils se retrouvent dans la même prison que quelqu’un qui connaît des techniques de manipulation. Le professeur en a expliqué quelques-unes : demander beaucoup, puis ensuite juste un petit peu et, après, ça passe…, et terminer ses phrases par“je vous laisse libre de votre choix”, ce qui donne deux à trois fois plus de chances d’accepter ».

Comme beaucoup de ses condisciples, Astor Bizard souligne l’originalité de l’approche. « Je suis loin d’être passionné d’histoire, mais le fait d’aborder les erreurs qui peuvent exister dans les livres d’histoire m’a plu. » Ce qui l’a le plus surpris, c’est l’évaluation en groupe. Un travail critique a été demandé sur un article dans une publication scientifique : l’hypothèse débouchait-elle sur un résultat ? Les quatre étudiants sont venus argumenter dans le bureau de Richard Monvoisin, qui a débattu avec eux, avant de leur demander quelle note ils pensaient mériter. « On n’en avait pas la moindre idée : est-ce que ça valait 8 ou 14 ? Finalement, on a eu 14 et c’est ce qui nous a semblé le plus juste, une fois la surprise passée. »

Aujourd’hui, il n’existe plus de laboratoire spécialisé en recherche zététique en France. Le collectif Cortecs est l’héritier des cours interdisciplinaires du professeur Henri Broch – un des parrains et des conseils du Cortecs. Son laboratoire de zététique à Sophia-Antipolis (Alpes-Maritimes), où Richard Monvoisin avait fait sa thèse, n’assure plus d’enseignements universitaires. Grenoble pourrait reprendre ce flambeau.

Zététique ou « art du doute » est ainsi définie par un article de Richard Monvoisin dans l’Observatoire zététique :

« Dérivant du verbe grec zêtein (chercher), la zététique désigne, au IIIe siècle avant l’ère chrétienne, le “refus de toute affirmation dogmatique” (école de Pyrrhon). Utilisé par Montaigne, Viète, Thomas Corneille, le mot échoue dans le Littré de 1872 puis dans le Larousse de 1876 comme “nuance assez originale du scepticisme : c’est le scepticisme provisoire, c’est (…) considér[er] le doute comme un moyen, non comme une fin, comme un procédé préliminaire, non comme un résultat définitif”. Le mot est finalement repris dans les années 1980 pour désigner l’enseignement critique en question ».

Adrien de Tricornot

Pour le off, un peu de patience, ça arrive.

Le CORTECS dans La Repubblica – 22 février 2015

CORTECS_repubblicaRichard Monvoisin, du CORTECS, a répondu à une entrevue avec une journaliste de la Repubblica, le plus grand quotidien italien.  Pour le coup, sur 45 minutes de discussion, le résultat est très correct – ce n’est pas si souvent.

Version italienne seulement. En pdf, télécharger ici.

“Così insegniamo ai nostri alunni il pensiero critico”

di Anais Ginori   22 Febbraio 2015
 
Uno strumento di autodifesa per chi vuole mantenere intatta la propria capacità di pensare, apprendere, valutate e quindi agire in modo sensato. Particolarmente utile in un’epoca in cui la manipolazione delle menti è diventa un sofisticato strumento di potere. La Repubblica, 2 febbraio 2015

Liberi di criticare. Sono quasi dieci anni che all’università di Grenoble viene insegnata l’arte del dubbio. L’ateneo ha un corso di “Zetetica e Autodifesa intellettuale” frequentato da centinaia di studenti ma anche semplici curiosi, affascinati da una materia nuova e unica in Francia. La cattedra è guidata da Richard Monvoisin insieme ad altri insegnanti del Cortecs, Collectif de recherche transdisciplinaire esprit critique et sciences.

Com’è nata l’idea di un corso specifico?
«La zetetica, inventata da una scuola greca di scettici radicali nel IV secolo a. C., è stata riscoperta nel Novecento come investigazione scientifica su fenomeni paranormali da un americano di origini italiane, Marcello Truzzi, e poi dal francese Henri Broch. Dopo essermi laureato in didattica e scienze fisiche, ho fatto il mio dottorato con Broch. Mi sono accorto che la zetetica poteva essere una disciplina trasversale».

Su cosa si fonda questa disciplina?
«Partiamo sempre dall’analisi delle fonti, dalla ricerca su informazioni non verificate, dalla demistificazione di cifre o frasi vuote. Nel nostro collettivo ci sono specialisti di ogni disciplina, dall’informatica alla biologia, dalla medicina, all’economia, alle scienze politiche. Ormai ci sono corsi di zetetica anche a Marsiglia, Montpellier. Lavoriamo su temi diversi come il creazionismo o i gender studies, Internet aperto e la xenofobia in politica. L’obiettivo di Cortecs è mettere in rete contributi diversi, invitando altri esperti a dialogare con noi, in un processo evolutivo di conoscenza».

Perché nel titolo del corso si parla di “autodifesa intellettuale”?

«E’ una metodologia che combatte la manipolazione delle opinioni o l’emergenza di nuove forme di consenso. Come diceva Noam Chomsky, il pericolo è tanto più grande per chi studia e fa professioni intellettuali. Nel mondo accademico anglosassone c’è già chi insegna il critical thinking ».

È più facile oggi manipolare le opinioni?
«Sono nato nel 1976 e ho vissuto l’avvento di Internet come una benedizione. Ero convinto che le generazioni dopo di me avrebbero avuto accesso a ogni tipo di informazione. Oggi invece i giovani rischiano di annegare nella vastità della Rete oppure di accontentarsi di una rappresentazione parziale. Dietro una schermata di Google ci sono interessi economici che molti purtroppo ignorano. La pluralità delle fonti è uno dei punti di partenza. Se voglio farmi un’opinione su Vladimir Putin, ad esempio, cercherò di leggere testi francesi, russi e ucraini. Inoltre, la rapidità nella diffusione delle informazioni rende ancora più facile errori di analisi. Suggerisco ai miei alunni di aspettare almeno qualche settimana prima di prendere posizione su un evento. Insieme al dubbio, bisogna praticare un ritmo lento del pensiero».

La zetetica è una forma di scetticismo?
«Lo scetticismo è un atteggiamento filosofico che si può riassumere con la frase di Bertrand Russell: “Dammi una buona ragione di pensare quello che pensi”. La zetetica è la metodologia pratica dello scetticismo. Il nostro scopo è aiutare la libertà di pensiero dei cittadini».

Eppure i dubbi dilagano sul web, alimentando le teorie del complotto. Vi occupate anche di questo?
«Intanto non le chiamiamo teorie, ma scenari, miti moderni, perché non sono confutabili e dunque non rispettano il criterio di falsificabilità di Karl Popper. Quando ci troviamo di fronte a scenari complottisti, come quello sull’11 Settembre, non facciamo altro che usare nozioni di epistemologia, applicando il criterio di massima parsimonia o il cosiddetto “Rasoio di Occam” che prediligono spiegazioni dimostrabili e semplici. L’esercizio funziona quasi sempre».

Avete già affrontato il tema dell’informazione sugli attentati di Parigi?
«Cominceremo un nuovo ciclo questa settimana dal titolo “Censura e libertà di espressione”. Noi pensiamo che sia meglio pubblicare il libro di Eric Zemmour (popolare saggista francese contro l’immigrazione, n.d.r.) oppure autorizzare gli spettacoli di Dieudonné. Piuttosto che impedire a qualcuno di esprimersi, trasformandolo in una presunta vittima, è meglio diffondere strumenti critici e di analisi. La zetetica dovrebbe essere insegnata già nelle scuole ai bambini. Piuttosto che la censura, è meglio scommettere sull’intelligenza collettiva».

 

Le CORTECS sur France Inter – 22 février 2015

CORTECS_maison_rondeLe CORTECS a été invité à causer dans le poste dimanche 22 février, sur France Inter.  Guillemette Reviron et Denis Caroti ont fait le déplacement dans la maison de la radio. Chacune de nos interventions médiatiques méritant un regard critique, nous vous proposons d’écouter l’émission, puis nous vous raconterons les dessous, et notre point de vue sur la question.

L’émission est ici : http://www.franceinter.fr/emission-3d-le-journal-zetetique-ou-lart-du-doute

Elle est audible ici :

Téléchargeable