Découvrir l'intelligence artificielle à partir d'un jeu publié le 31/03/2022  - mis à jour le 16/06/2022

TraAM 2021 - 2022

Pages : 123456

Sommaire des TraAms "Intelligence Artificielle"

Cet article présente la première partie de l’expérimentation qui est suivie d’une seconde partie de programmation (voir Intelligence artificielle et programmation Python)

L’apprentissage automatique

L’apprentissage automatique est un champ d’étude de l’intelligence artificielle qui se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d’« apprendre » à partir de données qui lui sont fournies ou qu’elle génère elle-même.
La qualité de l’apprentissage et l’efficacité de la démarche algorithmique sous-jacentes sont donc fortement dépendantes de la sélection et du traitement des données transmises à la machine.

Une possibilité de guider la machine dans l’environnement des données est de mettre en place un système de punition/récompense qui lui permette d’identifier et sélectionner les choix pertinents qui lui permettront d’élaborer la stratégie optimale répondant au problème.

Ce paradigme appartient au domaine de l’apprentissage par renforcement qui consiste à améliorer un algorithme par l’expérience en se basant sur une démarche par essais-erreurs.

Le jeu Hexapawn

Hexapawn a été inventé en 1962 par Martin Gardner, un écrivain américain de vulgarisation scientifique. C’est une sorte de jeu d’échecs miniature sur un damier de 9 cases avec 3 pions par joueur (d’où le nom « Hexapawn » qui signifie « six pions »).
Les règles du jeu peuvent être consultées en cliquant sur l’image ci-dessous. Vous pouvez aussi consulter la notice de jeu proposée par le palais de la découverte dans un article dédié à cette expérience.

Règles du jeu Hexapawn

Règles du jeu Hexapawn

Le but poursuivi par Gardner était de construire un jeu déterministe dont le nombre de parties différentes est suffisamment petit pour être représentable par un nombre limité d’états de jeux.
Ainsi, dans sa configuration originale, le jeu consiste à opposer un humain à une "machine" composée de 24 boîtes d’allumettes contenant des perles de couleur.

IA papier de Martin Gardner

IA papier de Martin Gardner avec les 24 boîtes d’allumettes.

Étiquettes des 24 états de jeux pour construire l'IA en papier (PDF de 61.9 ko)

Étiquettes des 24 états de jeux pour construire l’IA en papier

Chaque boîte correspond à l’une des situations du plateau de jeu et les couleurs aux différents coups que la machine peut réaliser dans cette situation.
Lorsque c’est au tour de la machine de jouer, elle tire une perle au hasard dans la boîte correspondant à la situation et qui lui indique le coup qu’elle doit jouer. Cette perle est mise de côté et, à la fin de la partie, la règle est la suivante :

  • si la machine a gagné, toutes les perles sont remises dans leurs boîtes ;
  • si elle a perdu, la perle qui l’a fait perdre est éliminée et le coup associé ne peut plus être joué

En multipliant les parties, le retrait progressif des perles perdantes va permettre à la machine d’apprendre les bons coups en élaguant l’arbre de jeu pour ne conserver que les branches gagnantes.

Le jeu étant résolu, c’est-à-dire qu’il existe une stratégie gagnante pour les pions noirs gérés par la machine, l’algorithme converge vers cette stratégie gagnante au bout d’une dizaine de défaites de la machine.

 Page suivante : "Fiche synoptique" ; "Narration d’expérience"

Document joint

Cette archive contient l’intégralité des fichiers sources des documents (.tex, .py, .ipynb, .ods) utilisés pour la mise en œuvre de l’expérimentation