Esprit critique et phénomènes aléatoires publié le 27/05/2024

Traam 2023 - 2024

Pages : 1234

Narration de l’expérimentation, première partie : la double approche des probabilités

Le programme de mathématiques du cycle 4 précise les repères suivants en ce qui concerne les probabilités :

Au cycle 4, les élèves sont confrontés à diverses situations de travail sur des données : les utiliser, les représenter, les interpréter de manière critique. Ils abordent les notions d’incertitude et de hasard, afin de ne pas « subir » le hasard, mais de construire une citoyenneté critique et rationnelle.

 
Les élèves ont travaillé sur les notions élémentaires de probabilité : expérience aléatoire, issue, événement, probabilité. Ils ont construit leur intuition sur des situations concrètes fondées sur l’équiprobabilité, puis en simulant la répétition d’épreuves identiques et indépendantes pour observer la stabilisation des fréquences. Ce travail est poursuivi en seconde en faisant appel à une version vulgarisée de la loi des grands nombres, qui permet de construire un modèle à partir de fréquences observées pour un phénomène réel.

Cette dernière approche des probabilités marque un changement significatif de perspective. La probabilité cesse d’être simplement une mesure théorique préalable au déroulement d’une expérience aléatoire pour devenir une estimation de la tendance caractérisant une expérience aléatoire, établie à partir de l’observation d’un grand nombre de réalisations de cette dernière. Cette dualité dans la conceptualisation de la probabilité découle des développements mathématiques survenus au cours des trois derniers siècles, en particulier du théorème fondamental de la Loi des Grands Nombres. Ce théorème, formulé initialement par Bernoulli dans Ars Conjectandi, contribue à concilier les deux approches. De plus, le Théorème Central Limite, découvert par Moivre et Laplace, affine cette connexion en précisant la convergence des fréquences observées vers la probabilité théorique.

En termes d’enjeux d’enseignement, il paraît donc essentiel pour la formation de l’esprit scientifique, de faire vivre ces deux approches antagonistes mais complémentaires dans nos classes :

  • une approche "classique" ou "cardinaliste", fondée sur des considérations intuitives de symétrie ou de comparaison, dont les calculs de probabilités ne mobilisent que les propriétés physiques de l’objet probabilisé et s’effectuent a priori, donc indépendamment de l’expérience ;
  • une approche "fréquentiste" ou "objectiviste", fondée sur l’expérimentation et les statistiques, dont les calculs de probabilités s’obtiennent a posteriori, comme limites des fréquences de réalisation de l’événement, quand le nombre d’épreuves tend vers l’infini.

Dans cette perspective, il fallait trouver une situation probabiliste pour laquelle les deux approches pouvaient être évoquées afin de montrer la non-contradiction de celles-ci et surtout leur complémentarité dans la construction d’un modèle représentant la situation.

Une situation déclenchante pour confronter les opinions

Le choix s’est arrêté sur la situation fournie par la projection de la planche suivante, extraite de la bande dessinée Astérix et le devin (Goscinny et Uderzo, 1972) :

Extrait de la bande dessinée "Asterix et le devin", Goscinny et Uderzo, 1972

Extrait de la bande dessinée "Asterix et le devin", Goscinny et Uderzo, 1972 (cliquer sur l’image pour l’agrandir)

Après un temps de réflexion, l’interrogation a porté sur le choix du "devin" :

  • Avait-il intérêt à choisir le 7 s’il ne voulait pas passer pour un devin ?
  • Y-a-t-il des sommes plus "probables" que d’autres ? Si oui, dans quelles proportions ?

Un certain nombre d’élèves a spontanément répondu qu’il n’y avait pas de meilleur choix parmi les sommes possibles et que les issues étaient équiprobables. Ces premières réponses illustrent un biais cognitif bien connu des psychologues : le biais d’équiprobabilité, engendré par une mauvaise application du principe d’équiprobabilité, et qui consiste à penser qu’en l’absence d’information, tous les cas ont la même probabilité de se produire et que « le hasard implique nécessairement l’uniformité ».
Ces premières affirmations ont vite été contredites par quelques élèves qui ont justifié leur intervention en considérant les décompositions possibles des différentes sommes : pour la somme 2, il n’y a qu’une seule possibilité (1+1) alors que pour la somme 7, il y a 3 décompositions (1+6, 2+5, 3+4)
Ces arguments ont permis de répondre rapidement à la première interrogation mais le questionnement s’est poursuivi sur le cas de sommes dont le nombre de décompositions semble identique (6 et 7 qui possèdent "a priori" 3 décompositions chacune).
Je leur alors demandé comment faire pour vérifier cette hypothèse et un élève a alors proposé de réaliser concrètement l’expérience aléatoire en faisant des séries de lancers de deux dés.

Expérimenter : l’épreuve du réel

Les élèves ont donc été invités à se regrouper en binômes puis à lancer 100 fois deux dés, à relever les sommes obtenues puis à calculer la fréquence d’apparition de chaque somme.

Expérimentation du lancer de dés

La réalisation des lancers n’a pas posé de problème mais, sans surprise, le dénombrement des issues a été plus fastidieux. Les élèves devaient ensuite écrire leurs fréquences au tableau :

Relevé des fréquences à l'issue de l'expérimentation réelle

Relevé des fréquences à l’issue de l’expérimentation réelle

Cette exposition au tableau des différents échantillons a permis de mettre en évidence la variabilité du hasard et la notion de fluctuation d’échantillonnage. Les différences de fréquences entre certaines issues (la somme 2 contre la somme 7) a été confirmée mais la proximité d’autres sommes (6 avec 7) n’a pas permis de conclure.
Les élèves devaient ensuite envoyer leur réponses via un formulaire en ligne qui permettait de constituer un échantillon plus grand, de taille 1300. La constitution d’un échantillon de taille plus grand, dont on calcule les fréquences par moyenne des fréquences des échantillons envoyés, permet d’obtenir des informations plus précises mais la variabilité des fréquences ne permet pas encore de conclure.

Il leur est alors demandé comment on pourrait obtenir un échantillon de plus grand taille sans trop d’efforts et la solution informatique est rapidement suggérée : calculatrice, tableur, programme.

Simuler pour décider

Après avoir défini la notion de simulation, les élèves ont été lancés sur la constitution d’un échantillon de taille 100 à la calculatrice. La simulation par les fonctions aléatoires de la calculatrice est un peu plus rapide mais le décompte des issues demeure pénible et entaché d’erreurs de comptage.

Le passage au tableur a été vécu comme un soulagement car la procédure est entièrement automatisée. Cette séance de manipulation a permis de remettre en place des savoir-faire de base (formule, duplication) et a été l’occasion d’aborder des commandes plus spécifiques à la simulation (ALEA.ENTRE.BORNES, NB.SI).

De même, la taille des échantillons de chaque groupe a pu être augmentée sans effort, jusqu’à 50 000 et l’envoi par formulaire des fréquences de chaque groupe a permis de constituer un échantillon de taille 1 000 000, pour lesquels les fréquences offraient une certaine stabilité.

Pour terminer le parcours sur la simulation, il leur a été proposé de réaliser des échantillons grâce à un programme rédigé en langage Python dans l’interface Capytale. Les élèves ne connaissant pas le langage, l’introduction a été très guidée et la complétion des codes a été pilotée par le professeur :

Bloc de code informatique : voir l'article sur le site.
  
  1. import random # on importe le module random pour générer des nombres aléatoires
  2.  
  3. def lancer_un_de():
  4.     """simule le lancer d'un dé"""
  5.     lancer = random.randint(1,6)
  6.     return lancer
  7.    
  8. def lancer_deux_des():
  9.     """simule le lancer de deux dés et renvoie la somme des faces"""
  10.     lancer = None
  11.     return lancer
  12.  
  13. def frequence_deux_des(issue, nb_tirages):
  14.     """calcule la fréquence d'une issue dans un échantillon de taille nb_tirages"""
  15.     effectif_issue = 0 # cette variable va compter le nombre de fois où l'issue apparaît
  16.     for i in range(nb_tirages): # boucle Pour qui répète nb_tirages fois les mêmes instructions
  17.         tirage = None # on lance les deux dés en appelant la fonctions lancer_deux_des
  18.         if None : # si le tirage tombe sur l'issue entrée en paramètre
  19.             effectif_issue = None # on augmente le compteur d'une unité (incrémentation)
  20.     frequence_issue = None # calcul de la fréquence de l'issue dans l'échantillon de taille nb_tirages
  21.     return None # la fonction renvoie la fréquence de l'issue
Fiche de cours sur les fonctions informatiques et la simulation (PDF de 136.7 ko)

Fiche de cours sur les fonctions informatiques et la simulation

Cette première approche leur a permis d’appréhender le concept de fonction informatique et son implémentation en langage Python (mots clés def, return). En outre, il leur a été possible de constituer un échantillon de taille 2 000 000 en appelant successivement la fonction avec différentes valeurs du paramètre issue : frequence_deux_des(2, 2_000_000), frequence_deux_des(3, 2_000_000), ....
Bien entendu, ces appels successifs construisent des échantillons différents et les fréquences obtenues ne sont pas celles d’un échantillon unique : pour rendre cela possible, il aurait fallu stocker les 11 compteurs de sommes dans une liste mais cette notion informatique n’est vue qu’en première. Cette petite entorse a été passée sous silence car la taille des échantillons rendait cette différence négligeable.

De nouveau, l’envoi des réponses a mené à la constitution d’un échantillon collectif de taille 44 millions pour lequel une précision de l’ordre du millième a pu être atteinte.

Tableur de collecte des échantillons (OpenDocument Spreadsheet de 37.2 ko)

Tableur de collecte des échantillons

Lors de la séance suivante, en classe entière, un bilan complet a été établi sur les deux séances informatiques précédentes et l’affichage des dernières fréquences obtenues sur le "gros" échantillon ont permis de mettre en évidence des symétries et des rapports de proportionnalité. Ces considérations ont mené à l’émergence de la loi de probabilité et notamment, le dénominateur 36 comme nombre total d’issues :

Bilan des simulations et obtention de la loi de probabilité

Bilan des simulations et obtention de la loi de probabilité (cliquer sur l’image pour l’agrandir)

Réinvestissement de l’approche fréquentiste : détermination d’un jeu équitable

Les différences de probabilités constatées lors de l’obtention de la loi ont mené au prolongement suivant :

Comment construire un jeu à deux joueurs équitable en lançant deux dés ?

Ce questionnement proposé en demi-classe a mené à des protocoles différents selon les groupes :

  • premier groupe : chaque joueur lance un dé et si la somme est paire, c’est le joueur A qui gagne, sinon c’est le joueur B ;
  • second groupe : chaque joueur lance un dé et si la somme est comprise entre 7 et 10, c’est le joueur A qui gagne, sinon c’est le joueur B

Afin de vérifier la validité de leur proposition, je leur ai demandé de vérifier leur choix par une simulation. Les élèves ont alors repris leur script précédent sur Capytale et, en s’inspirant des fonctions déjà construites, ils ont défini deux fonctions :

  • une fonction de simulation de partie partie qui simule le lancer de deux dés et renvoie le nom du gagnant selon la condition choisie ;
  • une fonction de réalisation d’un échantillon test_equite qui simule un nombre de parties entré en paramètre et renvoie les fréquences de victoires de chacun des joueurs.
Bloc de code informatique : voir l'article sur le site.
  
  1. import random
  2.  
  3. def partie():
  4.     lancer_A = random.randint(1,6)
  5.     lancer_B = random.randint(1,6)
  6.     issue = lancer_A + lancer_B
  7.     if issue%2 == 0: # ou 7<= somme <=10 pour l'autre groupe
  8.        return "A"
  9.     else:
  10.        return "B"
  11.  
  12. def test_equite(nb_tirages):
  13.     victoires_A = 0
  14.     victoires_B = 0
  15.     for i in range(nb_tirages):
  16.         lancer = partie()
  17.         if lancer == "A":
  18.             victoires_A = victoires_A+1
  19.         else:
  20.             victoires_B = victoires_B+1
  21.     return victoires_A / nb_tirages, victoires_B / nb_tirages

En reproduisant avec un peu plus d’autonomie une situation analogue à la situation initiale, les élèves ont commencé à acquérir des repères en langage Python et ont identifié les éléments caractéristiques d’une simulation : fonction informatique qui simule l’expérience aléatoire, fonction de réalisation d’échantillon s’appuyant sur une boucle, avec un test et une variable "compteur" qui s’incrémente à chaque nouveau succès).

Conclusion

Ce parcours "initiatique" sur les probabilités a permis aux élèves de confronter leurs représentations initiales à la réalité de l’expérimentation, réelle ou simulée. Le biais de probabilité mis en exergue en début de parcours a illustré la notion de biais cognitif et les limites de la cognition, ce qui a mené à dégager des stratégies pour les dépasser : la simulation propose alors une démarche intellectuelle objectivée par le recours à la technologie et la stabilisation des fréquences observées est une preuve concrète qui a convaincu une majorité d’élèves.
Cette preuve par l’expérimentation a constitué un premier exemple de mise en œuvre de l’esprit critique face aux phénomènes aléatoires : notre intuition probabiliste peut nous tromper et il est indispensable d’apprendre à distinguer les interprétations validées par l’expérience, les hypothèses et les opinions liées à nos croyances.
Pour emporter la conviction des élèves et montrer la cohérence et la convergence des approches classique et fréquentiste, la représentation de l’expérience aléatoire sous la forme d’un arbre des possibles a permis de retrouver la loi de probabilité établie auparavant de manière empirique.

Arbre de possibilités représentant le lancer de deux dés

Arbre de possibilités représentant le lancer de deux dés (cliquer sur l’image pour l’agrandir)

Ainsi, la démarche didactique par la double approche a eu pour effet de donner davantage de crédit à la simulation comme moyen de produire des preuves de qualité et comme un outil fiable d’aide à la décision. L’expérimentation par la simulation sera de nouveau sollicitée dans la deuxième partie de la séquence.

 Page suivante : "Narration de l’expérimentation (II) : le problème des partis revisité"