En neuf jours, sans guide, sans vidéo et sans aide humaine, l’IA Dreamer de Google DeepMind a réussi à extraire un diamant dans Minecraft. Une prouesse technologique qui dépasse de loin le simple cadre du jeu.
Trouver un diamant dans Minecraft n’est pas une mince affaire. Il faut comprendre les mécaniques du jeu, collecter du bois, fabriquer les bons outils, creuser profondément tout en évitant la lave… Un processus complexe, même pour un être humain. Et pourtant, une intelligence artificielle vient de réussir cet exploit, seule, sans la moindre démonstration préalable. Son nom : Dreamer.
Développée par les équipes de DeepMind, la filiale d’intelligence artificielle de Google, Dreamer n’a pas été entraînée à jouer à Minecraft de manière classique. Contrairement aux IA précédentes, elle n’a pas observé de parties humaines, n’a reçu aucune instruction explicite, ni suivi de tutoriel. Elle s’est contentée d’explorer, d’essayer, de se tromper, et d’apprendre.
Un apprentissage par l’imagination
La clé de Dreamer réside dans une approche dite par “renforcement”, combinée à la capacité de se projeter mentalement. En d’autres termes, cette IA est capable d’imaginer les conséquences possibles de ses actions avant de les exécuter. Un peu comme si elle avait une intuition, ou du moins une forme de réflexion prospective, ce qui lui permet de privilégier les choix les plus prometteurs.
À chaque fois que Dreamer accomplissait une étape intermédiaire – comme fabriquer une table de craft, miner du fer ou créer une pioche en pierre – elle recevait un petit bonus de récompense. Ce système de renforcement progressif l’a incitée à persévérer sur le long terme, jusqu’à atteindre son objectif ultime : obtenir un diamant.
Mais pour compliquer encore un peu l’expérience, les chercheurs de DeepMind ont redémarré le monde Minecraft toutes les 30 minutes. Dreamer devait ainsi s’adapter à un environnement nouveau à chaque fois, sans jamais se reposer sur un monde connu.
Aussi rapide qu’un expert humain
Il aura fallu à Dreamer environ neuf jours de jeu en continu pour réussir à extraire son premier diamant. Un temps impressionnant pour une machine, surtout dans un environnement aussi riche et imprévisible que celui de Minecraft. À la fin de l’expérience, l’IA parvenait à atteindre son objectif en moins de 30 minutes, soit le même temps qu’un·e joueur·se expérimenté·e.
Selon Danijar Hafner, chercheur principal sur le projet, cette avancée représente bien plus qu’une simple victoire dans un jeu vidéo. « Dreamer constitue une avancée majeure vers des systèmes d’intelligence artificielle capables de généraliser leur apprentissage. Elle peut comprendre un environnement physique et progresser de manière autonome, sans qu’un humain lui dise exactement quoi faire. »
Un futur bien au-delà de Minecraft
Si Minecraft a servi de terrain d’expérimentation, c’est parce qu’il constitue un environnement particulièrement propice : riche, complexe, changeant et propice à la planification à long terme. Mais les implications de Dreamer vont bien au-delà de ce jeu.
En théorie, un tel système pourrait s’appliquer à des robots réels, capables d’apprendre à interagir avec le monde physique sans supervision constante. Que ce soit pour naviguer dans un entrepôt, effectuer des réparations ou même explorer des environnements hostiles, une IA capable de “rêver” les conséquences de ses actes pourrait révolutionner bien des domaines.
Une IA vraiment autonome
Ce qui distingue Dreamer des autres intelligences artificielles, c’est son autonomie totale. Là où les précédents systèmes avaient besoin de données humaines ou de scénarios prédéfinis, Dreamer apprend seule. Elle bâtit un modèle mental du monde qui l’entoure, explore, s’adapte, et surtout : généralise.
Dans un article publié dans la prestigieuse revue Nature, l’équipe de DeepMind souligne que Dreamer est, à leur connaissance, la première IA à avoir collecté un diamant dans Minecraft sans données humaines, sans tutoriels, sans “curriculum”. Une première mondiale, qui marque peut-être le début d’une nouvelle ère de l’intelligence artificielle.