Bon anniversaire à vous deux ! publié le 29/01/2021  - mis à jour le 09/04/2021

Modélisation en probabilités

Sommaire des TraAms "modéliser"

 

banniere_article

Description de la tâche de modélisation

Problématique

Est-ce rare que deux élèves d’une classe fêtent leur anniversaire le même jour ? La modélisation par les probabilités est-elle en accord avec la réalité ?

Niveau concerné

Classe de seconde

Modèle(s) mathématiques utilisé(s)

Dénombrement à l’aide d’arbre, probabilités, fréquence et échantillonnage

Autres compétences mathématiques mises en jeu

Chercher, calculer, raisonner, communiquer

Compétences numériques

Tableur et Python

Nombre d’heures envisagées

Trois séances d’une heure

Démarche de l’enseignant

Les premières questions que nous pouvons nous poser sont : pourquoi choisir une activité fondée sur une question paradoxale ? Qu’est-ce qu’un paradoxe ?
Diderot disait, « le paradoxe est une vérité opposée aux préjugés du vulgaire » et le dictionnaire mentionne : étymologiquement (para : « contre » et doxa : opinion), le paradoxe est une opinion ou une proposition à première vue surprenante ou choquante.

Apporter une réponse à une question paradoxale, c’est aller contre le sens commun et donc marquer les esprits.
Cette problématique devrait donc susciter la curiosité des élèves.
Notre objectif est de répondre, de façon fiable, à la question posée qui, de surcroît, est issue du monde réel.
C’est là qu’intervient l’utilisation d’un modèle. Citons David Ruelle :

« Un modèle consiste à coller une théorie mathématique sur un morceau de réalité ».

La solution est d’utiliser les probabilités, seul élément mathématique d’ailleurs, permettant d’étudier le hasard.
Mais, il y a souvent dans l’enseignement des probabilités une confusion entre le modèle que l’on utilise et la réalité que l’on veut étudier.
Et le recours à la simulation pour faire apparaître une fréquence limite peut avoir comme conséquence de renforcer cette confusion. Les élèves n’ayant pas en effet conscience que le modèle utilisé n’est pas la réalité.

Par ailleurs, les programmes de collège abordent l’approche des probabilités cardinalistes qui suppose l’équiprobabilité des issues et l’approche fréquentiste qui assimile une fréquence observée à la « probabilité théorique » sans que l’on connaisse la précision de cette approximation.
On peut donc s’attendre à ce que les élèves soient vierges de toute réflexion à ce sujet et fassent la confusion.
Mon intention est de faire émerger un questionnement sur ces approches et d’éveiller leur sens critique.

L’attendu final est de mesurer la véracité de notre modèle : est-il acceptable ? "Colle"-t-il à la réalité ?


Description du déroulement de la séance

Un travail préliminaire est effectué.
Pour introduire l’activité et susciter l’intérêt des élèves par des éléments puisés dans leur environnement, chacun est amené à effectuer un travail personnel de recherche à la maison. Je leur demande de récolter des données existantes sur des groupes de personnalités de leur choix et de les déposer sur un document collaboratif dont voici un extrait du récapitulatif (cliquer sur l’image pour l’agrandir).

Document collaboratif de recherche sur des groupes de personnalités

Aperçu du document collaboratif recensant le nombre de jours à deux anniversaires dans différents groupes de personnalités.

La séance commence par un sondage à l’aide d’un questionnaire en ligne comportant les deux questions suivantes :

1. Est-ce rare que deux élèves d’une classe fêtent leur anniversaire le même jour ?

2. Estimer la probabilité que deux élèves d’une classe de seconde de 35 élèves fêtent leur
anniversaire le même jour.

Voici les réponses obtenues à la question 1 :

Répartition des réponses à la première question

Copie d’écran des réponses à la première question du sondage.

Et celles obtenues à la question 2 :

Répartition des réponses à la deuxième question

Copie d’écran des réponses à la deuxième question du sondage.

C’est un moyen de connaître leur opinion sur la question posée, mais aussi, d’être en capacité de confronter en fin d’activité leurs réponses aux résultats mathématiques obtenus. Nous mettrons ainsi en évidence le paradoxe.

Vient ensuite pour les élèves, un temps de réflexion personnel par écrit sur la marche à suivre, la façon de s’y prendre pour apporter une réponse rigoureuse à la question.

Se dégagent deux types de démarches.

Un nombre conséquent cherche une valeur numérique quand d’autres assez nombreux s’orientent vers l’étude de données réelles. Enfin, pour quelques-uns, la page reste blanche. Il est donc intéressant pour moi de les accompagner vers l’obtention d’élèves virtuels et donc l’émergence d’une simulation. Nous noterons ces groupes A, B et C.

Le groupe B propose rapidement un cheminement exploitable : récolter les données au sein du lycée. Motivés, ils sont même prêts à parcourir les classes de l’établissement. Mais par commodité, je leur fournis les données préparées au préalable à l’aide de la liste que la direction du lycée m’a transmise. Ils se lancent alors dans un travail de tri, classement, et relevé des dates de naissance anonymes, rangées par ordre alphabétique et par classe, de tous leurs camarades du lycée.
Ils comptabilisent le nombre de classes de l’établissement répondant au caractère souhaité et obtiennent la fréquence de l’événement dans notre lycée. C’est un bon moyen de leur faire apprécier l’intérêt des fonctionnalités du tableur pour parvenir à leur fin plus aisément.
Cf. document suivant :

Fichier tableur des dates de naissances de tous les élèves du lycée (OpenDocument Spreadsheet de 42.2 ko)

Fichier tableur des dates de naissances des élèves du lycée pour la piste 1

Fichier tableur des dates de naissances des élèves du lycée

Aperçu du fichier tableur des dates de naissance des élèves du lycée, triées par ordre croissant.
(cliquer sur l’image pour l’agrandir).

Pour le groupe A, qui cherche à calculer la probabilité, une aide s’impose. Il est nécessaire à ce stade, de guider les élèves et de leur fournir un enchaînement de questions les amenant vers la modélisation correspondante. Les élèves n’ont pas acquis les automatismes qui peuvent les conduire spontanément à modéliser. Ils ont peiné à établir un arbre qui modélise la situation y compris en restreignant l’étude, dans un premier temps, aux mois de l’année et à une classe de quatre élèves. C’est le groupe qui a nécessité le plus grand accompagnement.
Cf. activité suivante :

Document élève pour l'activité sur les anniversaires (PDF de 68.3 ko)

Document élève pour l’activité sur les anniversaires

Arbre de probabilités envisagé pour la piste 3

Arbre de probabilités envisagé pour la piste 3

En outre, par manque de temps, ils ont appliqué le programme sur Python calculant la probabilité au lieu de le mettre en place.

Quant au groupe C, obtenir des élèves virtuels n’est pas une démarche qui leur vient à l’esprit. Modéliser une classe par des nombres aléatoires n’a pas été spontané, ni dans la démarche, ni sa mise en application, l’usage des fonctions du tableur faisant là aussi réellement défaut.
Mais une fois l’idée suggérée et les outils nécessaires apportés, ils sont enthousiastes et se lancent rapidement dans la confection d’un document sur le tableur. Ils obtiennent les résultats théoriques attendus. Ayant un nombre de données important, la fréquence de l’événement est proche de la probabilité théorique.
Cf. pistes suivantes :

Fichier tableur pour la simulation de l'expérience aléatoire (OpenDocument Spreadsheet de 229.5 ko)

Fichier tableur pour la simulation de l’expérience aléatoire, utilisé pour la piste 2

Est venu ensuite le temps de la synthèse et de l’analyse des résultats.

Compte-rendu rédigé par le groupe ayant suivi la piste 1

Compte-rendu rédigé par le groupe ayant suivi la piste 1

 

Compte-rendu rédigé par le groupe ayant suivi la piste 2

Compte-rendu rédigé par le groupe ayant suivi la piste 2

 

Compte-rendu rédigé par le groupe ayant suivi la piste 3

Compte-rendu rédigé par le groupe ayant suivi la piste 3

 

Bilan rédigé en classe

Bilan rédigé en classe

 


Les élèves et la modélisation

Les sollicitations préalables à la résolution du problème par le travail maison de recherche et le quiz ont pleinement joué le rôle attendu, à savoir, immerger les élèves dans le problème et provoquer de l’enthousiasme pour le résoudre. Il est issu de la réalité, tous les élèves se sentent concernés. Ils doivent trouver un moyen d’y répondre, utiliser un modèle. Il est toujours souhaitable qu’un modèle soit issu de la réflexion des élèves. Dans notre activité, il est indéniable que le travail préliminaire a influencé certains d’entre eux dans leur réflexion, dans l’élaboration d’une démarche et dans la recherche d’un modèle.

Mais tout l’intérêt pour nous est d’obtenir les deux types d’études souhaitées pour les comparer. Et tel est bien le cas : des élèves ont travaillé dans le domaine de la réalité et d’autres ont utilisé le modèle de Bernoulli que ce soit pour calculer la probabilité de l’événement, ou, pour obtenir une fréquence s’en rapprochant par simulation avec l’instruction « ALEA.ENTRE.BORNES(1 ;365) ».

Une première réaction s’est produite avec les probabilités, issues du modèle mathématique, qui sont en opposition avec les réponses au quiz de quasiment tous les élèves,

Probabilités de succès selon l'effectif du groupe

Tableau présentant les probabilités de succès selon l’effectif du groupe

La fréquence de l’échantillon par simulation a renforcé cette opposition à leurs préjugés.
Occasion ici de soulever la question : la fréquence de notre échantillon obtenue par simulation est-elle représentative de l’ensemble ? Ce qui nous amène à l’intervalle de fluctuation.

Intervalle de fluctuation

Copie d’écran de tableur présentant les bornes de l’intervalle de fluctuation.

Puis arrive la comparaison de ces résultats du modèle mathématiques à ceux de la réalité.
Il est regrettable de ne pas avoir pu exploiter les récoltes de données sur les personnalités à cause de la taille trop faible de l’échantillon obtenu.
En revanche, les données du lycée sont exploitables et nous obtenons la différence attendue.

Fréquence de l'événement sur l'échantillon formé par les élèves du lycée Branly

Copie d’écran de tableur donnant la fréquence de l’événement pour les élèves du lycée Branly

Nous pouvons également illustrer notre propos avec les données de l’INSEE donnant le nombre de naissances par jour.

Nombre de naissances par jour en France en 2019

Répartition des naissances en France selon les jours de l’année 2019

Le sens critique est éveillé et les questions émergent spontanément des élèves :
Pourquoi cette différence ? Qu’est-ce qui pourrait expliquer que le modèle ne « colle » pas à la réalité ?

Les élèves viennent écrire leurs propositions de réponses au tableau.

Proposition d'élèves pour expliquer la différence entre le modèle et la réalité

Photo du tableau de classe où sont notées les propositions d’élèves.

Pour conclure, cette activité met bien en lumière le paradoxe. De plus, elle permet de constater que les modèles mathématiques nous donnent des résultats qui ne concordent pas toujours avec les résultats réels.

En conséquence, la question de la véracité des modèles mathématiques est sous-jacente, chose rarement remise en cause dans l’enseignement, les élèves faisant généralement confiance à leur professeur.

Prolongement et perspectives

Il serait intéressant de faire réfléchir les élèves sur la différence entre la stabilisation de la fréquence pour une expérience et la variation de la fréquence d’une expérience à l’autre dans le cadre d’un travail sur les fluctuations d’échantillonnage.

Documents de référence

Document élève pour l'activité sur les anniversaires (PDF de 68.3 ko)

Document élève pour l’activité sur les anniversaires

Travail préparatoire de l'activité (PDF de 51 ko)

Fiche de consignes pour le travail à faire à la maison afin de préparer l’activité

Fichier tableur récapitulatif sur les groupes de personnalités (OpenDocument Spreadsheet de 20.6 ko)

Fichier tableur récapitulatif sur les groupes de personnalités

Fichier tableur des dates de naissances de tous les élèves du lycée (OpenDocument Spreadsheet de 42.2 ko)

Fichier tableur des dates de naissances des élèves du lycée pour la piste 1

Fichier tableur pour la simulation de l'expérience aléatoire (OpenDocument Spreadsheet de 229.5 ko)

Fichier tableur pour la simulation de l’expérience aléatoire, utilisé pour la piste 2

Retour au Sommaire des TraAms "modéliser"