À l’instar du supercalculateur Deep Blue qui a battu Garry Kasparov aux échecs ou le programme informatique Watson qui a gagné un jeu télévisé américain, l’intelligence artificielle est depuis longtemps capable de battre l’homme. Maintenant c’est au tour d’un système autodidacte.
Tant le supercalculateur Deep Blue qui avait battu le champion du monde d’échec Garry Kasparov en 1997, ou le programme informatique Watson avait gagné un jeu télévisé américain en 2011, ces machines dotées d’une certaine intelligence artificielle étaient créées dans un but précis, ce qui n’est pas le cas de DQN.
DQN, pour deep-Q-network, est en effet un agent d’intelligence artificielle qui nécessite un minimum d’information, pour s’améliorer, il apprend lui-même en expérimentant tel un jeune enfant.
Confronté à des jeux vidéo avec comme seules informations les pixels et le score, il s’est mis à découvrir lui-même des stratégies qui lui permettent de progresser.
Conçu par DeepMind, une entreprise appartenant à Google, DQN est parvenu, en apprenant tout seul, à battre l’homme sur une trentaine de jeux vidéo datant des années 1970 et 1980, notamment l’iconique Space Invaders. « C’est la première fois que l’on conçoit un système d’apprentissage général unique qui soit capable d’apprendre directement à partir de l’expérience pour maîtriser ensuite une vaste gamme de tâches difficiles », a expliqué Demis Hassabis, cofondateur de DeepMind.
Pour fonctionner, DQN utilise un algorithme qui associe plusieurs techniques d’apprentissage informatique à des mécanismes inspirés du fonctionnement des réseaux neuronaux.
« Au départ, il était un peu comme un bébé, découvrant le monde pour la première fois. Puis, il a appris en pressant des touches au hasard et en repérant quand cela lui permettait d’avoir de bons scores », a expliqué Demis Hassabis. Par exemple, pour Breakout, il a stupéfié les informaticiens en découvrant une technique très efficace qui consiste à creuser un tunnel.
Alors que DQN n’est pas encore adapté aux jeux en 3D, ce sera justement l’objectif que ce sont fixés les ingénieurs de DeepMind : « s’attaquer à des jeux des années 1990 en 3D, nettement plus compliqués. »
« L’idée serait que si un algorithme permet de simuler la conduite dans un jeu de course automobile, potentiellement avec quelques améliorations, il devrait être capable de conduire une vraie voiture », estime Demis Hassabis.