AlphaZero, le programme Gamechanger développée par DeepMind qui a transformé notre vision du jeu d'échecs !
Un peu d’histoire…
AlphaZero est un logiciel de jeu de Go, d’échecs et de Shogi développé par Demis Hassabis de DeepMind, une entreprise du groupe Google. Ce logiciel a été mentionnée pour la première fois en 2017 sur une plate-forme de prépublication en ligne. Son approche – différentes des logiciels de jeu d’échecs courant - se base sur AlphaGo Zero et nécessite un calcul bien moindre que ses concurrents.
Niveau de jeu d'AlphaZero et AlphaGo comparé aux autres machines (source : deepmind)D’après DeepMind, 24 heures ont suffi à ce logiciel pour dépasser ses rivaux humains et logiciels, que ce soit au Shogi, au Go ou encore aux échecs. Stockfish – le meilleur logiciel d’échecs d’alors - est terrassé dans un match de 100 parties contre ce malheureux programme !
Stockfish perd sans gagner la moindre partie !
Stockfish n’a pas gagné la moindre partie lors de ce duel. Concédant 3 parties avec les pièces blanches pour 47 nulles et concédant 25 parties avec les pièces noires, pour 25 parties nulles. Le score final est sans appel : 64-36 en faveur d’AlphaZero ! AlphaZero l’emporte avec autant de points qu’il y a de cases sur un échiquier !
Liste des parties sur lichess : match AlphaZero vs Stockfish8 !
Comment fonctionne AlphaZero ?
Son fonctionnement est basé sur un réseau de neurones fonctionnant en continu, codé au préalable en prenant en compte des hyperparamètres. Pour affronter Stockfish, il n’a eu comme entraînement, que de jouer contre lui-même pendant 4 heures ! La machine aurait ainsi joué 44 millions de parties contre elle-même, en corrigeant ses erreurs toute seule !
Evolution du niveau de jeu d'AlphaZero et AlphaGoSon style est dynamique et essentiellement basé sur une vision à long terme. elle privilégie un jeu de pièces d'une précision incroyable, pensée pour sa structure de pions et l'activité, et n’hésite pas à sacrifier du matériel pour asseoir sa domination stratégique afin d’étouffer petit-à -petit son adversaire. Sa notion de valeur relative des pièces est incroyablement fine et corrélée au dynamisme de ses pièces.
Fonctionnement de la réflexion d'AlphaZero aux échecs par rapport aux grands-maîtres et aux autres machines (source : deepmind)Il est à noter qu’une version améliorée a vu le jour en 2019, il s’agit de MuZero, également développé par DeepMind.
Et les humains, où se situent-ils dans tout ça ?
Pour rappel, c’est en 1997, qu'un premier champion du monde d’échecs humain s’est incliné face la machine, il s’agissait du très célèbre match Kasparov vs Deep Blue !
L'homme a inspiré la machine, qui, à son tour inspire les hommes.
Aaron Nimzowitsch fut l'un des pionniers de cette idée selon laquelle la stratégie dominait la tactique aux échecs, et qu'une approche efficace pour gagner une partie d'échecs, était d'étouffer petit à petit son adversaire, en dynamisant ses pièces au détriment des pièces adverses. Une partie illustre cette technique parfaitement. On l'appelle la partie immortelle du Zugzwang !
Elle opposa Friedrich Sämisch à Aaron Nimzowitsch, en 1923 :
AlphaZero a influencé le champion du monde Magnus Carlsen !
Devant une telle démonstration de maîtrise de l'activité de pièces par la machine, souvent au détriment de quelques sacrifices subtils, le champion du monde - Magnus Carlsen - lui-même s'est inspiré d'AlphaZero pour améliorer son jeu et introduire davantage ce concept d'initiative dans ses propres parties !
Un livre retrace les frasques de la machine (le seul inconvénient est qu'il est écrit en anglais) :
Game Changer: Alphazero's Groundbreaking Chess Strategies and the Promise of Ai (lien Amazon)Sylvain Ravot, Maître Fide et entraîneur, nous gratifie d'une vidéo dans laquelle il analyse les parties entre AlphaZero et Stockfish :