La verité sortant du puits, tableau de Jean-Léon Gérome

Quand faut-il dépendre son jugement ? Ou l’objectif du scepticisme

La vérité est au fond du puits, nous dit-on1.
Voilà ce que nous répètent les sceptiques de tout poil depuis la nuit des temps : illusions d’optique, faux souvenirs, erreurs de jugement, limites de notre langage, erreurs de logique, sophisme, conformisme social, bulles de filtre, constructions socio-culturelles et toujours la possibilité d’un rêve, d’une simulation ou d’un malin génie, … et puis si ça se trouve vous n’êtes qu’un papillon en train de rêver d’être un humain2.
Les distorsions de l’information sont nombreuses et apparaissent à toutes les échelles. Il est alors tentant, à la manière de Pyrrhon, de sombrer dans l’indifférence, de ne donner pas plus de crédit à ceci qu’à cela, et laisser son jugement suspendu pour toujours. Ou alors il faut décider de dépendre son jugement – si celui-ci est suffisamment affiné.
Cet article propose quelques pistes de réflexion sur cet acte crucial dans la démarche sceptique : la dépendaison du jugement.

Juger et choisir

La vérité est au fond du puits, vous dis-je. Et il y a une solution toute trouvée : n’allons plus au puits. L’univers qui m’entoure m’est éternellement inaccessible – et encore, même ceci n’est pas certain – il n’y a pas de raison d’aller y chercher une quelconque vérité.

C’est, en tout cas, la réponse qu’apporte la première grande école du scepticisme3, celle de Pyrrhon, qui suspend son jugement aussi vite qu’il le peut. « Épochè« , nous dit-il4. C’est la suspension, l’interruption, l’arrêt du jugement. Alors, on s’assoit sur le bord de la réalité et on la regarde défiler.

Appliquer cette doctrine à des enjeux actuels donnerait quelque chose comme ça : Catastrophes écologiques ? Mouais, peut-être ; Inégalités sociales ? Pas plus que ça ; Covid ? J’en sais rien ; Guerre en Ukraine ? Je m’abstient5 ; Tu boiras quand même un petit coup ? Bof, à la rigueur.

Pyrrhon ira voter blanc. Ou il n’ira pas voter. Ou bien il ira. Cela importe bien peu au final. Rien n’est mieux que rien, rien n’est plus beau que rien. Même « rien n’est mieux que rien » n’est pas mieux que « certaines choses sont mieux que d’autres ». C’est dire.

Ainsi, puisqu’il n’affirme rien, le sceptique radical ne se trompe jamais. À la bonne heure. Mais évidemment, en contrepartie, il se condamne à ne plus dire, à ne plus faire, autant dire à ne plus être. Ou à être tout juste une plante.

S’il [le sceptique] ne forme aucun jugement, ou plutôt si, indifféremment, il pense et ne pense pas en quoi différera-t-il des plantes ?

Aristote, Métaphysique6

Cela semble être une position bien peu satisfaisante.
Pourtant, la suspension du jugement, lorsqu’elle est appliquée temporairement, est une position épistémologiquement très saine, voire indispensable. Tant que je ne connais pas suffisamment un sujet, il est raisonnable de rester prudent, jusqu’à ce que la cumulation de connaissance me permette de trancher.

S’il veut prétendre être davantage qu’un cactus au soleil, le sceptique doit, tôt ou tard, faire le choix de dépendre son jugement qu’il avait soigneusement suspendu quelque temps.

“Certes, nous pouvons pour un moment déclarer que tout est égal, que la réalité n’est qu’un rêve. C’est très bien, cela nous fait sourire comme Bouddha ; mais ensuite, si nous choisissons de continuer à vivre dans la réalité, nous ne pouvons que nous remettre en jeu, comprendre et choisir. Nous pouvons se faisant continuer à sourire, mais nous ne continuons pas moins à nous mettre en jeu, à comprendre et décider.[…] Parce que juger et choisir est la même chose que penser et vivre”

Carlo Rovelli, Anaximandre ou la naissance de la pensée scientifique
Photo de Carlo Rovelli devant un tableau noir
Carlo Rovelli, physicien et philosophe des sciences, devant un tableau noir avec des équations (ça fait plus intelligent)

Cette position philosophique s’appelle scepticisme scientifique. On suspend prudemment son jugement (c’est la partie sceptique), jusqu’à ce que toute la puissance de la rigueur et de la démarche intellectuelle (c’est la partie scientifique) nous en libère. C’est ce que nous appellerons ici « dépendre son jugement ».

Mais donc une tension apparait : la vérité absolue nous est à jamais étrangère et pourtant il faut finir par trancher. Trancher ce qui est suffisamment fiable pour qu’on puisse le tenir pour vrai.
Et réfléchir à la manière dont on fait ce choix semble crucial pour avoir une démarche sceptique raisonnable.

Quand faut-il « dépendre » son jugement ?

Considérons une affirmation A sur un sujet que je ne connais vraiment pas. Dans un premier temps, je n’exprime pas mon opinion sur le sujet. C’est ce que l’on appelle la suspension du jugement et c’est une position épistémologiquement saine (manière un peu pompeuse de dire « c’est pas con »).
Découvrant de mieux en mieux le sujet, j’accorde à l’affirmation A une vraisemblance croissante.
Mais à partir de quel degré de confiance en A, par rapport à non-A, est-il judicieux de commencer à exprimer mon opinion sur le sujet ? 51 % ? 75% ? 99% ? 100% ?
La réponse sceptique radicale serait 100% – autrement dit jamais – alors qu’une réponse assez crédule serait 51%.

Précisons, avant d’aller plus loin, que cela dépend fortement du contexte : je m’exprimerais avec plus ou moins de prudence suivant que ce soit au cours d’un repas de famille, d’une publication sur les réseaux ou d’un article scientifique. Mais ceci étant dit, cela ne change pas grand-chose à la suite de l’article.

Probablement que le plus judicieux est de naviguer quelque part entre ces deux positions. Mais pour trancher, il faut répondre à une question fondamentale : Qu’est-ce que l’on vise ?
Finalement, pourquoi sommes-nous sceptique, zététicien, ou penseur critique (selon votre terminologie préférée) ?7
L’importance de cette question était déjà identifiée par le philosophe David Hume :

Car voici la principale objection et la plus ruineuse qu’on puisse adresser au scepticisme outré8, qu’aucun bien durable n’en peut jamais résulter tant qu’il conserve sa pleine force et sa pleine vigueur. Il nous suffit de demander à un tel sceptique : Quelle est son intention ? Que se propose-t-il d’obtenir par toutes ces recherches curieuses ? Il est immédiatement embarrassé et ne sait que répondre.

Hume, Enquête sur l’entendement humain, cité dans Le scepticisme, Thomas Bénatouil
David Hume

Hume reconnait par ailleurs la puissance des principes sceptiques. Selon lui, ceux-ci « fleurissent et triomphent dans les écoles où il est difficile, sinon impossible, de les réfuter ».
Il leur reproche en revanche leur inutilité quand ils sont employés dans leur « pleine force » : « Mais un pyrrhonien ne peut s’attendre à ce que sa philosophie ait une influence constante sur l’esprit, ou, s’il en a une, que son influence soit bienfaisante pour la société ».

Héritier de ce scepticisme, les zététiciens aujourd’hui ne tombent pas dans le piège de l’indifférence interminable des pyrrhoniens qui laissent pour toujours leurs jugements suspendus. Non, bien au contraire, les zététiciens, dépendent leur jugement : ils démystifient, ils enquêtent, ils trouvent, ils se positionnent, ils s’opposent, ils twittent, etc.
Ceci dit, cela ne devrait pas nous exempter de répondre à la question de Hume : Qu’est-ce que l’on vise en faisant cela ? Quelle règle permet de trancher si un niveau de connaissance est suffisant pour donner son avis ?

Ce qui est et qui doit être

Pour trancher sur ce qu’il faut faire, ou autrement dit, ce qui doit être, il peut-être utile de s’en remettre au principe de la guillotine de Hume9 que l’on pourrait formuler ainsi : « Ce qui doit être ne peut se déduire de ce qui est« .

Une proposition sur ce qui doit être, que l’on qualifiera de prescriptive (ou normative, éthique, morale, axiologique, politique selon les contextes) ne se déduit pas d’une proposition descriptive – sur ce qui est – mais d’une autre proposition prescriptive10.
Par exemple : la proposition prescriptive « L’homéopathie doit être déremboursée » ne peut se déduire ipso facto de la prémisse descriptive « L’homéopathie n’a pas d’effet propre ». Il faut y adjoindre une autre prémisse prescriptive comme « Ce qui est inefficace doit être déremboursée ». Dans ce cas, la démonstration est rigoureuse (ce qui ne signifie pas que la conclusion est vraie, mais que la véracité des prémisses implique la véracité de la conclusion).

Ainsi, pour savoir quand dépendre son jugement, inutile de contempler l’univers ou de charcuter des équations mathématiques. Ce n’est pas dans ce qui est que l’on trouvera une réponse. Il faut avant tout adopter une prémisse prescriptive. Il faut s’adosser à un système éthique, une règle (ou un ensemble de règles) axiomatique qui guident ce qu’il est éthique de faire ou de ne pas faire, ce que l’on considère comme bien et mal11.

En conjuguant des propositions prescriptives à des descriptions factuelles, il est alors possible de déduire de nouvelles affirmations prescriptives.

Illustration du principe de la guillotine de Hume
Illustration du principe de la guillotine de Hume

Ce prisme-là permet, d’ailleurs, de justifier la position des sceptiques pyrrhoniens. Leur objectif primordial est d’atteindre l’ataraxie, c’est-à-dire l’absence de trouble. Voilà donc leur prémisse prescriptive.
D’autre part, ils développent un argumentaire qui ressemble à cela : La suspension du jugement (épochè), engendre l’absence de jugement (adoxastous) qui engendre l’absence d’affirmation (aphasie). Enfin, puisque ne rien affirmer épargne les déceptions, erreurs et faux espoirs, il s’ensuit l’absence de trouble (ataraxie). 12.
Conclusion implacable : Il faut toujours suspendre son jugement.

Guillotine de Hume appliquée au pyrrhonisme
Guillotine de Hume appliquée au pyrrhonisme

Il est évidemment possible de discuter de cette construction argumentaire en prenant soin de traiter les propositions descriptives et prescriptives en tant que telles. Il n’y a pas de sens à dire que la recherche de l’ataraxie est vraie ou fausse, comme il n’y a pas de sens à dire que le fait que l’aphasie implique l’ataraxie soit bien ou mal.

« Le sceptique, parce qu’il aime les hommes… »

La construction précédente n’est qu’une interprétation du scepticisme pyrrhonien – peut-être un peu naïve – qui ne rend pas entièrement hommage à cette pensée complexe qui ne se laisserait pas si simplement capturée dans un cadre aussi rigide.
Voyons maintenant, une autre interprétation du pyrrhonisme, qui permet également d’illustrer le principe de la guillotine de Hume. Elle se fonde sur cet extrait de Sextus Empiricus :

Le sceptique, parce qu’il aime les hommes , veut les guérir par le discours autant qu’il le peut, de la témérité et de la présomption dogmatique.

Sextus Empiricus , Esquisses Pyrrhoniennes

D’après ce passage, le principe prescriptif fondateur du scepticisme serait l' »amour des humains » ou autrement la défense des individus13 . En le conjuguant à une proposition descriptive implicite ici (quelque chose comme « La présomption dogmatique nuit aux humains »), on en déduit qu’il faut lutter contre la présomption dogmatique.

Interpertation de Sextus Empiricus du point de vue de la guillotine de Hume
Interprétation de Sextus Empiricus du point de vue de la guillotine de Hume

Petite parenthèse : ce passage semble mettre à jour un paradoxe entre deux justifications du scepticisme. D’une part la recherche de l’ataraxie, qui justifie de suspendre éternellement son jugement, d’autre part un engagement « humaniste » qui, semble-t-il, peine à justifier cette incessante aphasie (Si « le sceptique aime les hommes » doit-il suspendre son jugement devant les pires des injustices ?).
Une réponse à ce paradoxe est peut-être donnée un peu plus loin dans le texte de Sextus Empiricus dans un paragraphe intitulé « Pourquoi le sceptique s’applique-t-il parfois à proposer des arguments d’une faible valeur persuasive ? »

[Le sceptique] use d’argument de poids propres à venir à bout de cette maladie qu’est la présomption dogmatique pour ceux qui sont fortement atteints de témérité, mais il use de plus léger pour ceux qui sont superficiellement atteints par le mal de la présomption et facile à soigner et qu’il est possible de rétablir par une persuasion plus légère.

Sextus Empiricus, Esquisses Pyrrhonienne
Sextus Empiricus

Ce point de vue pourrait expliquer la position extrême des sceptiques de l’antiquité : en réalité, la force de leur discours s’adapte en fonction de leur interlocuteur et ce seraient les arguments les plus radicaux qui auraient été retenus par l’histoire.
Peut-être alors que le vrai projet pyrrhonien n’était pas tant de défendre un doute absolu et inconditionnel, presque insensé, mais plutôt de protéger les hommes des discours dogmatiques et la tradition n’aura retenu que les positions les plus radicales qu’ils tenaient face à leurs adversaires les plus coriaces. Peut-être.

Refermons cette parenthèse antique qui permettait surtout d’illustrer différentes constructions argumentaires qui aboutissent à différents projets sceptiques : suivant la prémisse prescriptive qui fonde le discours, les conclusions peuvent différer. Elle influence donc notre rapport à la suspension du jugement, mais pas seulement. Elle guide également le choix des sujets que l’on va traiter, le ton que l’on va adopter, l’audience à qui l’on veut diffuser ces idées, etc.

Prenons un exemple.
Considérons les deux propositions descriptives suivantes : « X prétend être atteint de la pathologie P »; « Il est très probable que X ne soit pas vraiment atteint de la pathologie P ». Doit-on, face à une telle situation, suspendre son jugement sur ce qui est vrai ou faux et sur ce qui est bien ou mal de faire ?
La réponse dépend de la prémisse prescriptive ; par exemple : « Il faut maximiser le bonheur de X », « Il faut dévoiler coute que coute la vérité sur P », « Il faut informer au mieux sur P sans nuire à X », etc.

Posture morale par défaut

Est-il possible d’échapper au choix ?

Non seulement le sceptique doit choisir. Mais pire, il le fait. Aussi attaché soit-il à la suspension du jugement, un sceptique finira tôt ou tard par choisir. La prétention à une indifférence absolue ne survit guère en dehors du confort d’un cabinet de philosophe. Elle s’évapore à l’instant où l’on quitte ces élégantes constructions mentales.

« Comme le doute sceptique résulte naturellement d’une réflexion profonde et intense […], il augmente toujours à mesure que nous poursuivons nos réflexions, qu’elles s’opposent à lui où lui soit conformes. Seules la négligence et l’inattention peuvent nous apporter quelques remèdes.
C’est pourquoi je leur fais entière confiance et j’admets sans discussion que, quelle que soit l’opinion du lecteur à cet instant, il sera dans une heure persuadé qu’il existe à la fois un monde extérieur et un monde interne ».

David Hume, Traité de la nature humaine, I,IV, II

Ainsi, impossible de se croire exempté de la laborieuse tâche qui consiste à s’interroger sur le fondement de son entreprise sceptique.
Que ce soit réfléchi ou non, toute démarche sceptique (et intellectuelle plus généralement) s’appuie sur des hypothèses sous-jacentes sur ce qui doit être.
La vérité est au fond du puits. Qu’est ce qui me donne suffisamment soif pour m’y pencher ?

Quelles valeurs par défaut ?

On pourrait alors réfléchir, à ce qui guide inconsciemment les choix moraux, aux prémisses prescriptives que l’on applique par défaut sans en avoir conscience. On prendrait alors le risque de sortir du champ de cet article (et de mes compétences) alors que d’autres l’ont déjà fait très bien (ici par exemple, ou plus récemment ).
Simplement, il semble que l’on peut remonter à quelques invariants dans notre manière de faire des choix inconscients parmi lesquels la consistance avec son groupe social. Qu’on l’appelle conformisme à la façon de Asch, ou capital symbolique à la manière de Bourdieu, notre conception du monde, et à fortiori notre conception du bien, s’aligne souvent sur la conception que s’en font nos semblables.

Beaucoup de nos actions sont mises en œuvre, non pas pour ce qu’elles sont, mais pour acheter le regard de l’autre.

Aurélien Barrau, extrait de conférence samplé dans Nouveau Monde de Rone.

Évidemment, les milieux sceptiques ne sont pas épargnés par ce mécanisme et certains comportements ou prises de position sont motivés, au moins partiellement, non pas par leur valeur épistémique intrinsèque ou leur bénéfice espéré, mais par ce qu’elles sont valorisées par la communauté.
Que ce soit dans le choix des sujets, dans le ton adopté, dans l’audience visée. Ainsi, semblent apparaitre certaines valeurs qui s’éloignent de la démarche sceptique et humaniste défendue il y a 2000 ans déjà par Sextus Empiricus : le sceptique, parce qu’il aime les hommes…

Application : Zététique et psychophobie.

Certains discours reprochent à la zététique d’être psychophobe notamment en ce qu’elle utiliserait à tort le champ lexical de la psychiatrie et/ou banaliserait des termes péjoratifs sur la santé mentale (fou/folle, démence, parano, perché, …). Une synthèse de cette critique peut être retrouvé dans l’article « Zététique & Psychophobie » de Sohan Tricoire.
D’autres voix se sont élevées contre cette critique parce qu’elle leur paraissait infondées, moralisatrice ou inutilement tatillonne.

Du haut de mon ignorance, difficile d’avoir un avis péremptoire sur la question :
Quel est l’impact réel de l’utilisation de ces termes ? Est-ce que le fait de décrire ces termes comme violents ne contribue-t-il pas, justement, à les faire ressentir comme violents ? Cette critique procède-t-elle, comme on peut l’entendre, d’une pureté militante propre à la culture « woke » ?
D’un autre coté, les personnes qui s’opposent à cette critique ne sont-elle pas, simplement sur la défensive face à un discours qui remet en cause leurs habitudes et qui les accuse d’une certaine violence ?
Est-ce que je peux, moi, remettre en question la violence ressentie par d’autres ? Et d’ailleurs, n’étant pas concerné, est-il judicieux que je m’exprime sur cette question ?

Toutes ces questions demandent des connaissances en linguistique, en psychologie, en sociologie, en philosophie voire en politique, que je n’ai absolument pas. De ce fait, comment me positionner face à cette question ?

Si, à la manière de Sextus, on adopte la défense des individus comme objectif premier, il en découle (assez naturellement) que la défense des individus marginalisés ou soumis à des oppressions, est d’autant plus important.
Ainsi, face aux doutes que je peux avoir, mon raisonnement revient à cet objectif premier et, dans certains contextes au moins, il me semble plus important de défendre la voix des oppréssé.e.s que de laisser mon jugement suspendu.

Il me semble que personne (ou peu) refuserait consciemment la posture « humaniste » proposée ici et déciderait à la place d’adopter un autre objectif comme le triomphe coute que coute de la vérité.
En réalité, ce qui empêche certaines personnes d’adopter cette position « humaniste » relève davantage d’un aveuglement par rapport à leur valeur morale implicite qui risque de se retrouver de facto calqué sur une idéologie dominante. Ce qui ramène à l’importance cette question déjà posée plus haut : « Qu’est ce que l’on vise ? »

Mensonges, sacrés mensonges et modèles de régression

Quel sera le record du 100m en 2100 ? C’est une question que se sont posée des chercheurs anglais dans un article de 2004 et qui, pour y répondre, ont déployé leurs outils statistiques de manière assez maladroite. Une erreur qui n’est qu’une perche tendue pour faire une lecture critique d’un article scientifique et montrer comment on peut prédire n’importe quoi en ayant l’air scientifique.

Et quand on dit “statistiques”, on entend déjà un chuchotement dans l’oreille qui nous rappelle à la prudence avec ces mots popularisés1 par Mark Twain : “Il y a trois sortes de mensonges : les mensonges, les sacrés mensonges et les statistiques” 2

Mensonge ou erreur, peu importe, toujours est-il qu’il est facile de (se) tromper avec des chiffres. Et une de ces erreurs potentielles concerne les prédictions que l’on peut faire à partir des données passées. Pour faire de telles prédictions, bien souvent la méthode est la suivante : on observe les données passées puis on prolonge la tendance observée dans le futur.
Il est donc nécessaire de décider comment prolonger ces données : c’est ce que l’on appelle le modèle de régression. Et ce choix peut-être assez fallacieux. Pour illustrer ceci, reprenons l’exemple des performances athlétiques sur 100m.

Les Jeux-Olympiques de 2156 seront historiques !

Pour prédire l’avenir des perfomances athlétiques, une manière de faire consiste à analyser l’évolution des performances passés pour en déduire l’évolution future. On trace sur un graphique les données passées, on trace une courbe qui a l’air de coller aux données et on peut prédire le futur ! Facile !

C’est ce qui a, donc, été fait dans un article publié en 2004 dans la revue Nature et dont le titre peut se traduire par “Un sprint historique aux Jeux Olympiques de 2156 ?”3.
Les auteurs de l’étude ont collecté tous les temps des champions olympiques, masculins et féminins, du 100m (depuis 1900 pour les hommes et -seulement- depuis 1928 pour les femmes, et jusqu’en 2004 date de publication de l’article). Ces données ont ensuite été tracées sur un graphique et approchées par une courbe supposée représenter la tendance (voir ci dessous).

Tiré de « Momentous sprint at the 2156 Olympics? ».
Les points bleus et rouge correspondent aux données passées : temps du vainqueur (respectivement masculin et féminin) du 100m aux JO par année.
Les pointillés épais représentent la prédiction future et les pointillés fins représentent les intervalles de confiances.

Ainsi l’étude prédit qu’en 2100 le temps féminin du 100m olympique sera d’environ 8.9sec et le record masculin sera d’environ 8.5sec. Il prédit également qu’aux Jeux Olympiques de 2156, le temps de la course féminine pourrait, pour la première fois, passer en dessous de celui de la course masculine. En prenant en compte une marge d’erreur, ils prédisent plus exactement que ce dépassement devrait avoir lieu entre 2064 et 2788 (!)

Cette information a été reprise dans différents médias, par exemple dans Les Echos, sur RDS média sportif canadien, ou en anglais dans The Telegraph ou dans Manchester Eveningnews.

Quelques critiques générales peuvent être émises sur ce résultat, notamment sur la qualité des données qui sont assez peu nombreuses (elle ne comprend qu’une information tous les 4 ans; d’autres articles sur le sujet, considèrent les meilleures performances annuelles) et pas très consistantes (le chronométrage et le règlement ont évolué pendant cette période).
Mais la critique principale concerne le modèle de régression utilisé, autrement dit le choix des tracés bleu et rouge supposés approximer les données.

Préparez le chronométrage négatif

Les auteurs de l’étude proposent d’utiliser une régression linéaire, c’est-à-dire une ligne droite qui passe au plus près des données. Ce choix peut être tout à fait opportun si le phénomène étudié correspond effectivement à une évolution linéaire, au moins localement. Mais est-ce le cas ici ?

Avec le jeu de données qui est proposé, on s’aperçoit qu’une approximation avec une droite semble, en effet, assez bien coller aux données et c’est ce que remarquent les auteurs : “Une gamme de modèles a été testée, […]. Les modèles linéaires (proposés ici) ont donc été adoptés car ils représentaient l’option la plus simple.”4.
Il semble donc que localement, à l’échelle de quelques décennies l’utilisation d’un modèle linéaire pourrait être pertinent.

Mais vous avez certainement remarqué le piège ici : en suivant les prédictions de ce modèle, dans un futur lointain, on finit par tomber sur des résultats absurdes : les temps finiront par arriver à 0s (aux alentours de 2615 pour les femmes et de 2876 pour les hommes) puis négatif (les Jeux Olympiques de l’an 3000 devraient se gagner en -6,67sec pour les femmes et en -1,39sec pour les hommes !). Cette absurdité a d’ailleurs été pointée du doigt dans le numéro suivant de Nature par la chercheuse en biostatistiques Kenneth Rice 5Si l’on prolonge dans le passé, on remarque aussi que les premiers athlètes olympiques (vers -800) auraient couru le 100m en environ 41 secondes pour les hommes et 59 secondes pour les femme (s’il y en avait eu).
Pour comparaison, le record actuel du 100m des plus de 105 ans est de 34”50).

Dans ce cas, l’utilisation d’une régression linéaire pour modéliser l’évolution des performances en sprint sur le long terme n’est pas du tout adaptée et ne nous dit en réalité rien de très intéressant sur les Jeux Olympiques de 2156.
Une critique de l’utilisation d’un modèle linéaire dans cette situation a également été publiée dans le numéro suivant de Nature par Weia Reinboud 6 (qui n’est pas une scientifique mais une athlète).

Affutez son regard critique sur les modèles de régression

Un exercice intéressant consisterait à réfléchir, en premier lieu, aux propriétés que doit avoir un bon modèle de régression, autrement dit quelle forme devrait avoir la courbe pour approximer les données de manière cohérente.
Dans le cas de la prédiction des performances athlétiques futures, en voici trois :

  • Comme on l’a vu, le modèle ne devrait pas décroitre indéfiniment. La courbe d’approximation doit atteindre un minimum, on dit qu’elle doit avoir une borne inférieure.
  • Cette borne inférieure doit être strictement positive (évidemment, le temps de course ne peut être ni négatif, ni nul).7.
  • Si l’on souhaite étendre l’extrapolation dans le passé pour estimer le meilleur coureur à chaque époque, il faut également que le modèle aie une borne supérieure.

Ces contraintes théoriques étant établies (et possiblement d’autres), il est alors possible de choisir un modèle de régression qui les respecte. C’est ce qui est fait par exemple dans l’image ci-dessous extrait d’un autre article8 sur cette même problématique.

Meilleurs performances annuelles en 100m masculin connues (croix) ou estimées (points). Les cercles représentent les records. Tiré de Volf (2011).
Le modèle de régression utilisé ici (en trait plein) a une pente qui diminue dans le temps ce qui correspond bien à un phénomène qui a une borne inférieure.

Une fois le modèle choisi, les paramètres doivent être ajustés pour coller au plus près aux données existantes et pouvoir ainsi prédire la tendance future.
Cette recherche d’un modèle de régression adéquat qui est ensuite ajusté aux données illustre le fait que souvent, un résultat scientifique robuste se nourrit d’une part d’une cohérence théorique et d’autre part d’une conformité aux données factuelles.

Alors évidemment ici l’enjeu est minimal et si ces chercheurs anglais et leurs prédictions pour 2156 ont fait cette erreur, par maladresse ou pour le buzz, les conséquences sont négligeables.
Il peut, cependant, être utile de garder à l’esprit que faire des prédictions futures à partir de données passées est assez périlleux et peut amener à des conclusions hasardeuses. Si l’on se soustrait à une rigueur scientifique, aux méthodes mathématiques qui encadrent ce type d’estimation et que l’on confie au cerveau humain le soin de tracer les lignes qui prolongent des tendances, il y a fort à parier que l’on retrouvera les biais que l’on connait déjà par ailleurs.

Bonus

Et en bonus quelques planches supplémentaires de xkcd qui n’en finit pas d’extrapoler des données au delà du raisonnable.

La résolution de Google Earth augmentera-t-elle jusqu’à dépasser la résolution de la réalité elle-même ? (qui correspond à la longueur de planck)
En 2012, il prédisait que le nombre de personnages légo surpassera le nombre d’humains autour de 2020. En 2022, il semblerait que ce soit effectivement le cas9.
La fréquence d’utilisation du mot « durable » semble croitre exponentiellement depuis les années 50.
Il prédit qu’en 2036, le mot durable apparaitra en moyenne une fois par page; qu’en 2061 ce sera en moyenne une fois par phrase puis qu’en 2109, les phrases ne seront composées que du mot durable répété inlassablement. Au-delà de cette date, c’est « terra incognita ».
xkcd: Curve-Fitting
Les méthodes de régression et ce qu’elle signifie. Linéaire : « Hey, j’ai fait une regression »; Quadratique : « Je voulais une ligne courbe, du coup j’en ai tracé une mathématiquement »; Logarithmique : « Regardez, ça plafonne ! « ; Exponentielle : « Regardez, c’est hors de contrôle »; LOESS : « Je suis sophistiqué, pas comme ces empotés de polynomieux »; Constante : « Je fais un graphique, mais j’ai pas envie »; Logistique :  » Il faut connecter ces deux lignes, mais ma première idée n’était pas assez mathématique ». Intervalle de confiance : « Bon, la science c’est compliqué. Mais je suis une personne consciencieuse qui fait de son mieux ». Par morceaux : « J’ai une théorie, et ce sont les seuls données que j’ai pu trouver ». Lignes connectées : « J’ai cliqué sur « Lisser les données » sur excel; Filtre ad-hoc « J’ai eu une idée pour nettoyer les données, tu en penses quoi ? »; Château de cartes : « Comme vous pouvez le voir, le modèle colle parfaitem- attends, non non ne prolonge paaaaaaas »

Les grands esprits critiques se rencontrent ? (REC 2021)

“En 20 ans dans le scepticisme, c’est l’événement en français, le plus impressionnant auquel je suis allé”, c’est avec ses mots que Jean-Michel Abrassart du Comité Para, a commencé son intervention lors de la première édition des Rencontres de l’Esprit Critique organisée en septembre à côté de Toulouse. Deux membres du Cortecs y sont également intervenus, on vous raconte !

Le but de ces rencontres était de faire converger en un même lieu, des acteurs de l’esprit critique francophone et un public familial intéressé par cette thématique (mais possiblement déjà acquis à ces idées). L’événement a rassemblé plus de 800 personnes au cours de la journée.
Après une inauguration avec les élus locaux (tradition oblige ?), la première table ronde avait pour thème “la place de l’esprit critique aujourd’hui” et réunissait un parterre de quatre vulgarisateurs et vulgarisatrices web. Une uniformité des point de vue possiblement dommageable à la richesse du débat, mais certainement profitable au succès de l’évènement !

Pendant la journée se sont enchaînées des tables rondes où différents intervenants ont échangé sur les liens entre Esprit Critique et Recherche, Sciences humaines et sociales, Santé, Éducation et enfin Informations1.
Si la présence d’universitaires était plus importante au cours de ces tables rondes, on pourrait reprocher la surreprésentation de vulgarisateurs à la défaveur des chercheurs (surreprésentation parfois pointée du doigt par les vulgarisateurs eux-mêmes). 

En parallèle de ces tables rondes, se tenaient également une série d’interventions à destination des plus jeunes utilisant des sujets ludiques (Harry Potter, jeux vidéos, insectes & araignées, …) pour parler d’esprit critique.

Enfin, la journée s’est conclue par deux moments divertissants présentés par le mentaliste Clément Frèze : Un burger quiz, sauce zététique, et son spectacle “La séance”.

La très longue file d'attente à l'entrée
La très longue file d’attente à l’entrée

Intervention des « cortexiens »

Denis Caroti est intervenu lors de la table ronde sur le thème “Esprit critique et éducation”, thématique au cœur du projet du Cortecs. Dans cette table ronde, il était accompagné du vulgarisateur “vieux de le vieille” (sic) Jean-Michel Abrassart auteur de la BD pour enfant “Zack et Zoé, zététiciens en herbe”, de Philippe Hubert coresponsable de l’IRES, groupe de recherche sur l’enseignement de l’esprit critique et de Bertrand Monthubert ancien président de l’Université Paul Sabatier à Toulouse. Cette table ronde a notamment permis de discuter de la place et de l’enjeu de l’éducation à l’esprit critique, que ce soit pour la formation des enseignants ou celle des élèves. Vous pouvez retrouver cet échange en vidéo ici

En dehors de ces tables rondes qui concentraient l’essentiel de la programmation et du public, se tenaient également des ateliers où vous pouviez tester vos dons de sourciers, découvrir les biais cognitifs et les sophismes, porter un regard critique sur l’histoire via un jeu vidéo, ou encore créer votre propre recherche bidon.

C’est dans ce cadre que Nicolas Martin a proposé lui aussi un atelier pour discuter de l’approche bayésienne de l’esprit critique en proposant, notamment, de participer à un QCM bayésien.
Dans cette forme d’évaluation, le questionné n’est pas contraint de donner une réponse unique (et potentiellement aléatoire) à la question, mais doit au mieux estimer son incertitude en exprimant la vraisemblance de chacune des réponses. Le questionné donne donc à chaque réponse un score correspondant à la crédibilité qu’il lui assigne2.

Le QCM bayésien de Nicolas (et bien d’autres) est disponible ici sur le site bayes-up.

Si cet exercice semble a priori favoriser la nuance, la métacognition et (donc) l’esprit critique, il serait intéressant d’avoir davantage de recul et d’étude sur celui-ci.
Nicolas a également présenté les résultats de l’enquête “Combien t’y crois ?” qui proposait aux questionnés de donner leur degré de croyances en une trentaine de propositions. Les résultats seront également disponibles (très) prochainement en ligne.

Une belle fête de l’esprit critique

Cet événement est une première en France à cette échelle et on peut s’en féliciter. Bien entendu, tout n’était pas parfait et on pourra reprocher à l’organisation de ne pas avoir fait venir l’ensemble des scientifiques qui travaillent au quotidien sur ces sujets. Nous commettrions néanmoins deux erreurs : celle de la solution parfaite (à l’impossible nul n’est tenu et on peut déjà se satisfaire de ce premier pas), et celle du biais du survivant (on ne voit que les personnes qui ont répondu oui à l’invitation, pas celles qui ont été invitées…). Cependant, il reste encore du travail pour que cet événement reflète plus que des tendances médiatiques et populaires, et mette davantage en avant le travail des personnes de terrain (notamment sur le terrain éducatif), qu’elles soient chercheuses, formatrices ou enseignantes, et dont l’expérience pourrait apporter un discours plus proche de la réalité. D’ici à en faire un colloque de recherche/enseignement, il n’y a qu’un pas qu’on pourrait souhaiter pour les années à venir…

Malgré les quelques reproches (être critique, sur un évènement d’esprit critique, c’est de bonne guerre !), l’événement est une belle réussite et a permis, nous l’espérons, de donner une certaine visibilité à la diffusion de l’esprit critique et de son enseignement pour lequel nous militons depuis toujours. Nous tenons également à saluer la gratuité de l’événement ainsi que l’invitation à donner une contribution libre au profit de l’association “Tout le monde contre le cancer”.

Le public dans la grand place !

Nous remercions l’organisation de nous avoir invités à partager nos points de vue et espérons que les Rencontres de l’Esprit Critique se poursuivront et s’amélioreront au fil des années en n’oubliant pas un objectif qui nous semble fondamental : Apporter au plus grand nombre, et notamment à celles et ceux qui n’y ont pas facilement accès, les outils épistémologiques et méthodologiques nécessaires pour exercer une pensée critique affûtée, tournée aussi bien vers ses propres opinions que vers l’examen des discours de tout ordre !

Vers une vision bayésienne de la zététique: Justifier et enrichir la démarche zététique à partir de la formule de Bayes

Nicolas Martin, après avoir étudié les mathématiques appliquées à l’INSA Toulouse, a obtenu son doctorat en automatique au sein du GIPSA-lab et de l’université Grenoble Alpes. Il s’intéresse depuis plusieurs années à la zététique, l’esprit critique et leur transmission auprès du public. Depuis début 2020, Il publie des articles de vulgarisation scientifique et d’esprit critique sur le blog « Mon Œil ! »1Voici une de ses productions:

La zététique est un mouvement de pensée qui promeut l’utilisation de la pensée critique et de la méthode scientifique pour traiter efficacement le tsunami d’informations qui nous parvient chaque jour. Il semble néanmoins que cette démarche serait plus efficace encore si elle était soutenue par une vision bayésienne c’est-à-dire une approche qui prône l’usage des probabilités pour quantifier nos croyances. La démarche zététique est régulièrement le fruit de critiques : elle parait parfois dogmatique, parfois antipathique et parfois inapte à répondre à certains problèmes. Nous verrons dans cet article que le raisonnement bayésien soutient l’approche zététique et lui apporte un peu de nuance. Récemment, plusieurs travaux dans la communauté zététique sont allé dans ce sens, initiés principalement par Lê Nguyen Hoang (influencé par les travaux de Julia Galief écrivaine, conférencière et co-fondatrice du Center for Applied Rationality), avec son livre « La formule du savoir », sa série de vidéos sur le sujet 2 et ses podcasts3, l’approche bayésienne et ses apports à la zététique ont également été traités par Christophe Michel (animateur de la chaine Hygiène mentale)4, Nathan Uyttendaele (animateur de la chaine Chat Sceptique)5 ou encore Thibaud Giraud (animateur de la chaine Monsieur Phi)6. C’est dans ce mouvement que s’inscrit cet article dont l’objectif principal est de montrer comment le bayésianisme corrobore et enrichit certains outils zététiques.
Nous présenterons dans un premier temps quelques points critiques de la zététique qui motivent l’introduction d’un cadre bayésien. Nous introduirons ensuite succinctement le formalisme bayésien avant de présenter dans la dernière partie la contribution principale de cet article : la déduction de deux principes zététiques, rasoir d’Ockham et maxime de Hume, à partir de la formule de Bayes, formule sur laquelle se base l’approche bayésienne.
Cet article est loin de faire le tour de la question. Au contraire, comme son titre l’indique, le but ici est de fournir quelques arguments invitant à une réflexion plus poussée sur l’apport de l’approche bayésienne à la zététique.

Les limites de l’approche zététique

Il semble que l’approche zététique ait une mauvaise image de la part des croyant-e-s et des tenant-e-s des affirmations para-scientifiques7 mais pas seulement, certaines critiques viennent des zététiciens eux-mêmes8. Si certaines critiques peuvent être maladroites, d’autres en revanche nous paraissent pertinentes. Notons également que la plupart des critiques ne concerne pas la zététique dans son essence mais des écueils dans lesquelles il est facile de tomber. Nous proposons une liste de ces critiques ci-dessous. Nous verrons ensuite en quoi le bayésianisme peut répondre en partie à ces défaillances.

Des principes dogmatiques

Le rasoir d’Ockham, la maxime de Hume, la charge de la preuve, la valeur d’une preuve, l’impossibilité de prouver l’inexistence… Ces principes se posent parfois comme des dogmes de la zététique. Ce n’est pas un problème en soi puisque leur justification apparaît a posteriori : On se rend compte, en les utilisant, qu’effectivement on a tendance à se tromper moins souvent. En revanche, justifier a priori que ces principes sont cohérents, sont suffisants et nécessaires est une question plus complexe mais qui soutiendrait d’autant plus la démarche zététique.
En réalité, nous le verrons plus loin: le rasoir d’Ockham et la maxime de Hume peuvent se déduire de la formule de Bayes, formule dont on peut également justifier la cohérence.

De bons outils dans des mains maladroites

Carl Sagan dans The Fine art of Baloney Detection accompagne son texte de cette note appelant à la précaution : Like all tools, the baloney detection kit can be misused, applied out of context, or even employed as a rote alternative to thinking. But applied judiciously, it can make all the difference in the world — not least in evaluating our own arguments before we present them to others9. De même, dans son article critiquant la zététique, Sylvain Poirier fait remarquer : Ce n’est pas parce que beaucoup de principes zététiques affichés sont bons, que tout ce que disent les zététiciens est à croire sur parole. Si la zététique apporte un panel d’outils finement aiguisés, ils peuvent parfois être délétères lorsqu’ils sont utilisés sans un peu d’esprit critique.

Manque d’un formalisme mathématique

Le rasoir d’Ockham nous invite à “Privilégier l’hypothèse la plus parcimonieuse”. Mais comment quantifier la parcimonie d’une hypothèse ? Quelle métrique utiliser ?
La maxime de Hume, elle, stipule que “Une affirmation extraordinaire requiert des preuves extraordinaires”. Mais comment quantifier cette extraordinarité ? Et comment comparer l’extraordinarité d’une affirmation et l’extraordinarité des preuves ?
Bonne nouvelle, même si ces préceptes font office de principes généraux sans prétendre avoir une quelconque valeur quantitative, ils peuvent en fait être déduit de la formule de Bayes. Qui plus est, cette dernière leur donne un sens mathématique.

Manichéisme des arguments

Le curseur de vraisemblance10 invite à graduer la vraisemblance d’une affirmation sur une échelle continue entre 0% et 100%. Cette précaution apportée à notre jugement sur une théorie est bénéfique mais elle disparaît souvent quant on juge les preuves qui soutiennent la théorie : Il n’est pas rare d’entendre que tel argument est soit valide soit invalide; que le manque de rigueur d’un protocole invalide les résultats d’une expérience; que l’on peut jeter un discours puisque l’on y relève l’argument fallacieux n21 ou le n3711. Il semble cependant que l’on perde de l’information en disqualifiant complètement une preuve imparfaite12. Dans son article critiquant la zététique, Sylvain Poirier écrit: Le fait qu’il y ait des impostures et des erreurs de toutes sortes à la base de certaines affirmations du paranormal ou d’autres choses par les uns ou les autres, ne signifie pas que tout y est faux ni que rien n’aurait pu être effectivement prouvé. Est-il bien raisonnable de considérer la valeur d’un argument comme binaire ? Il semble peu probable qu’un protocole soit parfait tout comme il est peu probable que tout soit à jeter. En replaçant la zététique dans un cadre probabiliste, on quitte le maigre13 {0;1} pour l’infiniment plus riche14 [0,1].

Difficulté de conclure

“Est-il préférable pour la guérison d’une entorse de dormir avec un coussin bleu ou avec un coussin rouge ?”. Face à l’inexistence d’expériences randomisées en double aveugle avec groupe de contrôle, le zététicien doit-il s’enfuir laissant là son jugement suspendu ?
Devant bien des affirmations il semble que les outils de la zététique ne permettent pas de conclure. En particulier, on évoque souvent la hiérarchie suivante : une étude isolée est moins pertinente qu’une méta-analyse et une méta-analyse est moins pertinente que le consensus scientifique15. Mais alors, que dire d’un sujet sur pour lequel il existe peu ou pas d’étude ? Que dire d’un sujet face à un faisceau d’indices réduit et/ou peu rigoureux ? L’approche bayésienne permet de prendre en compte des informations de toutes sortes afin de se faire une opinion.

Et donc ?

L’approche bayésienne offre une perspective qui répond en partie aux critiques sus-citées en permettant de :

  1. Quantifier la validité d’une information et la probabilité d’une affirmation.
  2. Corroborer certains des principes dogmatiques de la zététique évoqués ci-dessus
  3. Replacer le discours zététique dans un langage probabiliste : Utiliser une formule comme « Il est très improbable que X » plutôt qu’un plus catégorique « À l’heure actuelle, il n’y a aucune preuve de X » rend le discours plus humble et plus propice à un échange bienveillant16.

Les apports du bayésianisme

Pour ne pas alourdir l’article la présentation du bayésianisme est assez minimaliste. Le lecteur curieux est invité à se référer aux références données dans l’introduction.

De la formule de Bayes

Le bayésianisme se base sur la formule de Bayes dont il tire son nom. La manière la plus simple d’écrire cette formule est la suivante

(1)   \begin{equation*}\Prob{A|B} = \frac{\Prob{A}\Prob{B|A}}{\Prob{B}}\end{equation*}

Les termes ℙ(A|B) et ℙ(B|A) sont des probabilités conditionnelles et se lisent respectivement “Probabilité de A sachant B” et “Probabilité de B sachant A”. La formule de Bayes permet donc simplement de lier les deux probabilités conditionnelles.

Exemple : On considère un lancer de dé, et on cherche à savoir quelle est la probabilité que le dé soit tombé sur 6 sachant que le dé est tombé sur un chiffre pair. On parle donc de probabilité conditionnelle car on cherche la probabilité d’un évènement en connaissant des informations partielles sur cet évènement.
Dans la formule de Bayes 1, on remplace A et B respectivement par “Faire un 6” et “Faire un nombre pair”. On va donc pouvoir calculer ℙ(A|B), la probabilité de “Faire un 6” sachant qu’on a “Fait un nombre pair”, ce qui est bien ce qu’on recherche. On obtient :

\small \Prob{\text{Faire un 6}|\text{Faire un nombre pair}} = \frac{\Prob{\text{Faire un 6}}\Prob{\text{Faire un nombre pair}|\text{Faire un 6}}}{\Prob{\text{Faire un nombre pair}}}

Ce qui se lit : la probabilité que j’ai fait un 6 sachant que j’ai fait un nombre pair est égale à la probabilité de faire un 6 (égale à 1/6) multipliée par la probabilité de faire un nombre pair sachant que j’ai fait un 6 (égale à 1) divisée par la probabilité de faire un nombre pair (égale à 1/2). Ce qui donne :

    \begin{equation*} \Prob{\text{Faire un 6}|\text{Faire un nombre pair}} = \frac{1/6 \times 1}{1/2} = 1/3 \end{equation*}

que l’on peut facilement vérifier.

À la formule du savoir

Initialement cette formule est un simple outil de calcul de probabilité conditionnelle relativement simple, et c’est ainsi qu’elle est enseignée aux étudiants. Cependant, réinterprétée, notamment par Pierre-Simon de Laplace, elle est devenue un profond principe épistémologique, que certains considèrent comme la formule ultime du savoir17 fondant ainsi le bayésianisme.
Comme nous le verrons, la formule de Bayes permet de calculer la vraisemblance d’une affirmation en fonction de la vraisemblance a priori de cette affirmation et d’une nouvelle information. Autrement dit, elle permet de mettre à jour nos croyances en fonction des preuves que l’on peut rencontrer : témoignage, étude scientifique, reportage TV, article de presse, …
Le théorème dit de Cox-Jaynes permet même de s’assurer que c’est la bonne manière de faire. Ce théorème montre que la logique bayésienne découle de certains prérequis naturels18 et qu’elle est donc indispensable pour manipuler raisonnablement de l’information.


La théorie des probabilités n’est rien d’autre que le sens commun qui fait calcul — Pierre-Simon de Laplace

Retour à la zététique

Nous voilà rendus bien loin des préoccupations zététiques. Mais en apportant une légère modification à la formule de Bayes ci-dessus nous allons y revenir. Changeons tout simplement le A dans la formule par affirmation, et le B par preuve19. Et voilà, nous avons un outil mathématique puissant pour estimer la vraisemblance d’une affirmation à partir de preuves (que ce soit des témoignages, des études, des arguments, …).
Mise en pratique :

    \begin{equation*} \Prob{\text{Affirmation}|\text{Preuve}} = \frac{\Prob{\text{Affirmation}}\Prob{\text{Preuve}|\text{Affirmation}}}{\Prob{\text{Preuve}}} \end{equation*}

\Prob{\text{Affirmation}|\text{Preuve}} est ce que l’on cherche à évaluer: la vraisemblance d’une affirmation à partir de preuves. Plus précisément, on cherche à calculer l’évolution de la confiance à accorder en une affirmation lorsque une nouvelle preuve est disponible. Cette quantité est aussi appelée probabilité a posteriori puisqu’elle correspond à la vraisemblance de l’affirmation après avoir pris en compte la preuve.
Par opposition, \Prob{\text{Affirmation}} représente la probabilité a priori. C’est à dire la vraisemblance de l’affirmation avant de prendre en compte la preuve. C’est un des principes fondamentaux du bayésianisme : notre croyance en une affirmation évolue sans cesse en fonction des nouvelles preuves qui nous parviennent.
\Prob{\text{Preuve}} est la probabilité a priori d’observer la preuve. Insistons: ces deux dernières probabilités (\Prob{\text{Affirmation}} et \Prob{\text{Preuve}}) sont calculées dans l’état initial des connaissances, c’est-à-dire sans prendre en compte la nouvelle preuve.
Enfin, la formule de Bayes nous dit que pour trouver \Prob{\text{Affirmation}|\text{Preuve}}, il nous faut, de plus, la probabilité d’observer cette preuve si l’affirmation est vraie. Cette probabilité est notée: \Prob{\text{Preuve}|\text{Affirmation}}, et est également appelée « fonction de vraisemblance », ou simplement « vraisemblance ».
On peut alors calculer \Prob{\text{Affirmation}|\text{Preuve}}, la probabilité a posteriori de l’affirmation, c’est-à-dire la confiance à accorder en l’affirmation20 une fois pris en compte les nouveaux éléments de preuve relativement aux connaissances préalables. D’une certaine manière, la formule décrit comment utiliser raisonnablement le curseur de vraisemblance connu des zététiciens.
La dépendance aux connaissances initiales peut sembler gênante puisqu’elle est subjective et risque de faire aboutir deux personnes à des conclusions différentes. Cependant la formule de Bayes assure qu’avec un nombre de preuves suffisant les probabilités a posteriori convergent vers une même valeur quelque soit la probabilité a priori.
Avec ces notations, une affirmation est très probable si \Prob{\text{Affirmation}} est proche de 1 et inversement très improbable si \Prob{\text{Affirmation}} est proche de 0. De même, \Prob{\text{Preuve}} proche de 0 correspond à une preuve très improbable dans le cadre initial de nos connaissance donc à une preuve que l’on peut qualifier d’extraordinaire (par ex. « Il a neigé en Août »), alors que \Prob{\text{Preuve}} proche de 1 est une preuve banale c’est à dire une information à laquelle on s’attend (par ex. « Il a neigé en Janvier »).
Avant de voir les avantages du cadre bayésien dans la démarche zététique, voyons un exemple rapide d’utilisation de la formule de Bayes dans un cadre zététique.

Exemple : La maison de mes grand-parents est connue pour être hantée, notamment la vieille chambre du fond. Armé de tout mon courage et de mes solides outils zététique je vais la visiter. J’émets deux hypothèses :

  • Affirmation Affirmation A_1 : « Il y a des oiseaux dans les combles à l’origine des phénomènes ». J’y attribue une probabilité de \Prob{A_1} = 0.9.
  • Affirmation A_2 : « Il n’y a pas d’oiseau dans les combles et la maison est vraiment hantée ». J’y attribue une probabilité \Prob{A_2} = 0.1 ça paraît fou mais la croyance est tenace dans la famille et dans le village.

En arrivant dans la chambre, et non loin en dessous d’une ouverture dans le plafond qui donne accès aux combles, je vois une plume d’oiseau. Voilà ma nouvelle preuve P qui va me permettre de mettre à jour mes croyances. On peut estimer la probabilité de trouver une plume là sachant qu’il y a des oiseaux dans les combles \Prob{P|A_1} = 0.05 : c’est commun de trouver des plumes mais encore fallait il qu’elle passe par cette petite ouverture. De même on estime la probabilité de trouver une plume sachant qu’il n’y a pas d’oiseau \Prob{P|A_2} = 0.0001 : c’est très peu probable, il aurait fallu que quelqu’un l’amène ici. On peut enfin calculer la probabilité de trouver une plume \Prob{P} grâce à la formule suivante21: \Prob{P} = \Prob{P|A_1}\times\Prob{A_1} + \Prob{P|A_2}\times\Prob{A_2} = 0.04501.
On peut maintenant appliquer la formule de bayes pour A_1 et A_2.

    \begin{equation*} \begin{split} \Prob{A_1 | P}& = \frac{\Prob{A_1}\Prob{P|A_1}}{\Prob{P}}\\ \Prob{A_1 | P} & = \frac{0.9 \times 0.05}{0.04501}\\ \Prob{A_1 | P} & \approx 0.9998 \end{split} \end{equation*}


et

    \begin{equation*} \begin{split} \Prob{A_2 | P} & = \frac{\Prob{A_2}\Prob{P|A_2}}{\Prob{P}}\\ \Prob{A_2 | P} & = \frac{0.1 \times 0.0001}{0.04501}\\ \Prob{A_2 | P} & \approx 0.0002 \end{split} \end{equation*}

Après mise à jour des vraisemblances j’attribue donc une probabilité de 99,98\% pour l’affirmation A_1 et 0,02\% pour l’affirmation A_2.
Évidemment faire une telle analyse chiffrée n’est pas possible au quotidien et ce n’est même pas utile à vrai dire. Mais il est très bénéfique d’adopter une pensée bayésienne en prenant l’habitude de mettre à jour la vraisemblance de nos croyances et en musclant notre intuition bayésienne22.

On peut maintenant voir en quoi cette approche permet de répondre aux critiques formulées dans la section précédente :

  • Elle peut être utilisée pour justifier les principes a priori arbitraires de la zététique. Puisque le théorème de Cox-Jaynes montre que l’approche bayésienne est la seule cohérente, alors démontrer les principes zététiques par la formule de Bayes justifierait leur pertinence. C’est ce que nous ferons dans la dernière section pour deux de ces principes.
  • Puisque dans l’approche bayésienne tout est exprimé en fonction de probabilité on évite la binarité et la rigidité que peut prendre parfois le discours zététique.
  • Comme nous le verrons dans la dernière section, en plus de justifier le rasoir d’Ockham et la maxime de Hume, l’approche bayésienne apporte un cadre mathématique qui permet de quantifier ce qu’on entend par « l’hypothèse la plus parcimonieuse » ou une « affirmation extraordinaire ».
  • Alors que la zététique requiert parfois une étude approfondie d’un sujet pour obtenir une conclusion, l’approche bayésienne permet toujours d’attribuer une vraisemblance à l’affirmation quel que soit la quantité d’information dont on dispose.

Les outils zététiques dans une main bayésienne

Les deux premières parties ont permis de montrer ce que le bayésianisme peut apporter à la zététique et s’alignent avec des travaux pré-existants (notamment ceux de Christophe Michel présenté dans l’introduction). Cette dernière partie est une contribution plus personnelle (et plus technique aussi peut-être) et montre comment le cadre bayésien permet de justifier deux principes fondamentaux de la zététique : le rasoir d’Ockham et la maxime de Hume répondant ainsi partiellement23 à la première critique formulée.

Rasoir d’Ockham

Quand on est confronté à plusieurs affirmations expliquant un même phénomène, le rasoir d’Ockham nous invite à privilégier l’affirmation la plus parcimonieuse. C’est à dire, l’affirmation qui requiert les hypothèses les moins coûteuses intellectuellement. Cependant, la signification de parcimonie ne va pas toujours de soi en l’absence de quantifications.
Voyons ce que l’approche bayésienne peut en dire. Admettons que l’on ait trois affirmations A_1, A_2 et A_3 pour expliquer la même preuve P. les formules de Bayes s’écrivent alors :

    \begin{equation*} \begin{split} \Prob{A_1|P} & = \frac{\Prob{A_1}\Prob{P|A_1}}{\Prob{P}} \\ \Prob{A_2|P} & = \frac{\Prob{A_2}\Prob{P|A_2}}{\Prob{P}} \\ \Prob{A_3|P} & = \frac{\Prob{A_3}\Prob{P|A_3}}{\Prob{P}} \\ \end{split} \end{equation*}

Chercher l’affirmation à privilégier revient à chercher l’affirmation la plus probable au vu de la preuve, donc la plus grande de ces trois probabilités. En multipliant toutes ces quantités par \Prob{P}, on cherche donc l’affirmation maximisant \Prob{A_i} \Prob{P|A_i}.
Ce qui peut se lire : Probabilité de l’affirmation A_i multipliée par la probabilité d’observer la preuve P sachant que l’affirmation A_i est vraie. La formule de Bayes nous dit donc comment interpréter le terme « plus parcimonieux » du rasoir d’Ockham. Ce n’est donc pas simplement l’affirmation la plus probable qu’il faut privilégier, c’est à dire \Prob{A_i}, mais bien le produit de cette probabilité avec la probabilité d’observer P sachant que A_i (l’exemple à venir rendra la nuance plus claire). On peut en déduire une nouvelle formulation pour le rasoir d’Ockham:

Rasoir d’Ockham bayésien :L’hypothèse maximisant \Prob{A_i} \Prob{P|A_i} doit être privilégiée. C’est à dire l’hypothèse maximisant le produit de la probabilité de A_i et de la probabilité d’observer la preuve P sachant A_i.

Cela peut sembler être une subtilité mais l’exemple suivant montre la différence induite par ce changement.

Exemple : Monsieur M. met dans une boite un chat et un souris. Dix secondes après il rouvre la boîte et la souris a totalement disparu. On peut émettre plusieurs affirmations :

  1. A_1Le chat a mangé la souris
  2. A_2La souris est passé dans une dimension différente pour échapper au chat
  3. A_3Monsieur M. est magicien

Usons de notre rasoir d’Ockham bayésien pour voir quelle affirmation privilégier. On considère les probabilités a priori des affirmations suivantes : \Prob{A_1} = 0.8 : Les chats aiment manger des souris;
\Prob{A_2} = 0.0000001 : Je n’ai pas connaissance de souris ayant une telle capacité;
\Prob{A_3} = 0.1 : Je ne connais pas bien cette personne, mais il n’est pas impossible que ce soit un tour de magie.

  • Si on s’intéresse au curseur de vraisemblance utilisé classiquement en zététique, nous pourrions penser qu’il ne faut considérer que la probabilité a priori \Prob{A_i} de ces affirmations. Ainsi il semblerait que l’affirmation A_1 soit à privilégier.
  • Considérons désormais la seconde partie du calcul uniquement (celle qui prend en compte la probabilité d’observer la donnée si l’affirmation est vraie), et que nous appelons la fonction de vraisemblance ou simplement vraisemblance. La donnée en l’occurrence est la révélation du contenu de la boite 10 secondes plus tard sans souris. On a alors par exemple : \Prob{P | A_1} = 0.1 : Seulement 10 secondes pour manger une souris et ne laisser aucune trace… ça me parait suspect; \Prob{P | A_2} = 0.999 : Si la souris avait un tel pouvoir elle aurait en effet sûrement disparu; \Prob{P | A_3} = 0.95 : Si Monsieur M. est magicien alors il est très probable que la disparition de la souris soit son tour de magie. En ne regardant que cette « vraisemblance », c’est alors le voyage inter-dimensionnel qui est à privilégier.
  • Dans un cadre bayésien, c’est la probabilité a posteriori que nous devrions regarder. C’est le produit des deux quantités précédentes24. On trouve alors :

    \begin{equation*} \begin{split} \Prob{A_1}\Prob{P|A_1} &= 0.8 \times 0.1 = 0.08 \\ \Prob{A_2}\Prob{P|A_2} &= 0.0000001 \times 0.999 = 0.0000000999 \\ \Prob{A_3}\Prob{P|A_3} &= 0.1 \times 0.95 = 0.095 \end{split} \end{equation*}

Au final, l’hypothèse à privilégier est que Monsieur M. est magicien…
Dans l’utilisation classique du rasoir d’Ockham cette précision n’est pas faite et le terme « affirmation la plus parcimonieuse » peut prêter à confusion.
On peut donc résumer le calcul ainsi :

    \begin{equation*} \begin{split} & \text{Probabilité a posteriori (ou \textit{posterior})} = \\ & \text{curseur de vraisemblance non bayésien (ou\textit{ prior})} \times \text{vraisemblance} \end{split} \end{equation*}


Les termes posterior et prior sont communément utilisés dans le cadre bayésien comme indiqué dans la formule ci-dessus.

Maxime de Hume

Également appelée standard de Sagan, ou de Truzzi, ou de De Laplace25, cette maxime postule que « Une affirmation extraordinaire requiert une preuve extraordinaire ».
Ici encore, nous allons voir que le cadre bayésien permet de retrouver et de préciser cette affirmation. Reprenons à nouveau la formule de Bayes :

(2)   \begin{equation*}\Prob{\text{Affirmation}|\text{Preuve}} = \frac{\Prob{\text{Affirmation}}\Prob{\text{Preuve}|\text{Affirmation}}}{\Prob{\text{Preuve}}}\end{equation*}

Comme dit précédemment une affirmation est dite extraordinaire si elle est a priori très peu probable. Une telle affirmation vérifie donc \Prob{\text{Affirmation}} = \epsilon, où \epsilon est une quantité très petite. Pour que cette affirmation, une fois pris en compte le nouvel élément de preuve, soit vraisemblable, il faut donc une preuve qui mène à \Prob{\text{Affirmation}|\text{Preuve}} \approx1. On peut montrer que cette condition26 implique la relation suivante:

(3)   \begin{equation*}\Prob{\text{Preuve}} \ll \Prob{\text{Preuve}|\text{Affirmation}}\end{equation*}

Ainsi pour qu’une affirmation a priori extraordinaire devienne vraisemblable il faut donc que la probabilité d’observer la preuve soit beaucoup plus petite que la probabilité d’observer la preuve sachant l’affirmation (nous verrons un exemple plus loin). La formule de Hume se déduit simplement en observant que comme toute probabilité est inférieur ou égale à 1 on a \Prob{\text{Preuve}|\text{Affirmation}} \leq 1 et donc

(4)   \begin{equation*}\Prob{\text{Preuve}} \ll 1\end{equation*}

Ainsi la probabilité d’observer la preuve doit être très petite. En d’autres terme, la preuve doit être extraordinaire27 ! Ainsi, la formule de Bayes permet bien de démontrer la maxime de Hume.
Cependant la formule (3) en dit un petit peu plus :

la condition, \Prob{\text{Preuve}} \ll 1 n’est pas suffisante ! Il faut également que \Prob{\text{Preuve}} \ll \Prob{\text{Preuve}|\text{Affirmation}} et donc que la probabilité d’observer la preuve sachant l’affirmation ne soit pas trop petite ! C’est à dire qu’il faut que la preuve soit ordinaire si l’affirmation est vraie : \Prob{\text{Preuve}|\text{Affirmation}} \equiv 1.
On peut en déduire une nouvelle formulation pour la maxime de Hume.

Maxime de Hume bayésienne : Une affirmation extraordinaire requiert une preuve extraordinaire. Mais il faut aussi que la preuve soit ordinaire si l’affirmation est vraie.

Exemple :

Considérons l’affirmation A = « les licornes existent » que l’on peut qualifier d’extraordinaire. J’y octroie a priori une probabilité de un sur un milliard : \Prob{A} = 10^{-9} Pour que cette affirmation paraisse crédible, il faut donc observer une preuve P vérifiant \Prob{P} \ll \Prob{\text{P}|\text{A}}.
Considérons par exemple la preuve P_1 : « Quelqu’un a vu de loin une silhouette de cheval avec une corne sur le front ». Ce n’est pas une preuve si extraordinaire : il a pu se tromper, c’était peut-être une installation artistique, des petits malins ont pu attacher un postiche ou il a menti. J’estime la probabilité d’observer cela à un sur mille. On a donc \Prob{P_1} = 0.001. En revanche, il est clair que la probabilité que quelqu’un ait vu de loin une silhouette de cheval avec une corne sur le front sachant que les licornes existent est très élevée : P(P_1 | A) \approx 1.
On peut maintenant appliquer la formule de Bayes pour mettre à jour ma croyance en A sachant P_1 :

    \begin{align*} \Prob{A|P_1} & = \frac{\Prob{A}\Prob{P_1|A}}{\Prob{P_1}} = \frac{10^{-9} \times 1}{0.001} = 10^{-6} \end{align*}

Après cette preuve, j’octroie à l’existence des licornes une crédence de un sur un million. Cette preuve satisfaisait donc un seul des deux critères de la maxime de Hume bayésienne : elle est ordinaire si l’affirmation est vraie mais elle n’est pas extraordinaire en soi.
Au contraire prenons une autre preuve P_2 qui a une chance sur un milliard d’être observée : « J’ai fait 30 piles de suite ». La preuve est bien extraordinaire \Prob{P_2} \approx 10^{-9}. Mais là encore la preuve ne satisfait qu’un seul des deux critères de la maxime de Hume baysésienne : elle est extraordinaire mais elle n’est pas ordinaire si l’affirmation est vraie. En effet, ici les deux évènements sont décorrélés : l’existence de licorne ne rend pas plus ordinaire une suite de 30 piles P(P_2 | A) \approx 10^{-9}. Ça ne suffit donc pas à me convaincre. En l’occurrence la formule de Bayes donne:

    \begin{align*} \Prob{A|P_2} & = \frac{\Prob{A}\Prob{P_2|A}}{\Prob{P_2}} = \frac{10^{-9} \times 10^{-9}}{10^{-9}} = 10^{-9} \end{align*}

Ce deuxième cas est caricatural mais il soulève une erreur de logique : se contenter d’une preuve extraordinaire sans vérifier que cette preuve est beaucoup plus probable dans l’affirmation qu’elle cherche à valider.
Enfin une preuve satisfaisante pourrait donc être P_3 un article scientifique corroboré par plusieurs chercheurs et fournissant suffisamment d’informations sur l’existence de licornes et étayé par des vidéos et des photos. Une telle preuve serait tout à fait extraordinaire en soi (estimée pour l’exemple à une chance sur 800 millions) et totalement ordinaire si l’affirmation est vraie (estimée ici à 0.99\%). La formule de Bayes donne alors :

    \begin{align*} \Prob{A|P_3} & = \frac{\Prob{A}\Prob{P_3|A}}{\Prob{P_3}} = \frac{10^{-9} \times 0.99}{1.25*10^{-9}} = 0.792 \end{align*}

Ma crédence en l’existence des licornes est donc passé à environ 80\%.

Conclusion

Voilà donc quelques idées sur la complémentarité entre bayésianisme et zététique. Nous avons montré d’abord quelques écueils possible de la démarche zététique et comment le cadre bayésien permets en partie d’y répondre. Dans une dernière partie nous avons montré comment la formule de Bayes permet de retrouver et préciser deux principes de la zététique : le rasoir d’Ockham et la maxime de Hume.
Bien d’autres pièces restent à ajouter au puzzle afin d’obtenir un paradigme plus solide. Quid des autres principes de la zététique ? Des biais cognitifs et des sophismes ? Quid de la charge de la preuve ? Est-ce que la perspective bayésienne permet d’en dire quelque chose, voire d’enrichir ces concepts ? Néanmoins, à l’avenir, si votre recette zététique semble mécontenter votre auditoire, essayer d’y rajouter une pincée de bayésianisme pour la rendre plus légère.