La nouvelle version du programme AlphaGo de Google DeepMind se montre encore plus puissante que son prédécesseur.
Après être devenu le premier programme informatique capable de battre l’humain au go, un jeu extraordinairement complexe, et avoir remporté toutes ses parties contre les meilleurs joueurs mondiaux, AlphaGo vient d’être écrasé par une nouvelle version de ce programme, capable d’apprendre seul, sans données humaines.
Un auto-apprentissage
L’entreprise britannique Google DeepMind a annoncé dans la revue scientifique Nature, avoir mis au point une version, saluée comme une avancée majeure, qui peut maîtriser l’ancien jeu de plateau chinois à partir de rien, sans aide humaine. Basée sur un réseau de neurones artificiels, AlphaGo Zero - le nom de la nouvelle version -, dispose seulement de la règle du jeu et la position des pierres noires et blanches sur le plateau. Pour apprendre, le programme va jouer des millions de parties contre lui-même.
Après trois jours d’entraînement (soit presque cinq millions de parties) en autodidacte, il a battu la version 2016 d’AlphaGo. Après chaque jeu, il met à jour son réseau neuronal, ce qui en fait un joueur plus fort pour le prochain combat. «Cette technique est plus puissante que les précédentes versions d’AlphaGo car elle n’est plus contrainte par les limites de la connaissance humaine et est en mesure de créer des connaissances», ont expliqué les chercheurs.
AlphaGo a besoin des idées de l’homme
Les chercheurs étudient la possibilité que celle-ci puisse servir dans des domaines divers tels que la réduction de consommation d’énergie, la conception de nouveaux matériaux ou encore le repliement des protéines. «Pour nous, AlphaGo ne consistera pas seulement à gagner le jeu de Go», a déclaré Demis Hassabis, PDG de DeepMind. Il espère que les descendants d’AlphaGo travailleront aux côtés des humains en tant qu’experts scientifiques et médicaux.
Mais si AlphaGo Zero peut se passer des données humaines pour se perfectionner, la machine dépend toujours de l’intelligence de l’homme. «Les brillantes idées qui ont permis d’améliorer le programme ont été générées par l’homme», a précisé Anders Sandberg, futurologue à l’Université d’Oxford. «AlphaGo ne se programme pas tout seul !».