En neuf jours, sans guide, sans vidéo et sans aide humaine, l’IA Dreamer de Google DeepMind a réussi à extraire un diamant dans Minecraft. Une prouesse technologique qui dépasse de loin le simple cadre du jeu.

Trouver un diamant dans Minecraft n’est pas une mince affaire. Il faut comprendre les mécaniques du jeu, collecter du bois, fabriquer les bons outils, creuser profondément tout en évitant la lave… Un processus complexe, même pour un être humain. Et pourtant, une intelligence artificielle vient de réussir cet exploit, seule, sans la moindre démonstration préalable. Son nom : Dreamer.

Développée par les équipes de DeepMind, la filiale d’intelligence artificielle de Google, Dreamer n’a pas été entraînée à jouer à Minecraft de manière classique. Contrairement aux IA précédentes, elle n’a pas observé de parties humaines, n’a reçu aucune instruction explicite, ni suivi de tutoriel. Elle s’est contentée d’explorer, d’essayer, de se tromper, et d’apprendre.

Un apprentissage par l’imagination

La clé de Dreamer réside dans une approche dite par “renforcement”, combinée à la capacité de se projeter mentalement. En d’autres termes, cette IA est capable d’imaginer les conséquences possibles de ses actions avant de les exécuter. Un peu comme si elle avait une intuition, ou du moins une forme de réflexion prospective, ce qui lui permet de privilégier les choix les plus prometteurs.

Illustration représentant une figure encapuchonnée dans un désert, face à un temple orné d’un visage de Creeper, pensant à une pioche pixelisée de Minecraft.
Pour progresser, Dreamer s’imagine les conséquences de ses actes, comme ici avec l’objectif de fabriquer une pioche en vue d’explorer un temple inspiré de Minecraft.

À chaque fois que Dreamer accomplissait une étape intermédiaire – comme fabriquer une table de craft, miner du fer ou créer une pioche en pierre – elle recevait un petit bonus de récompense. Ce système de renforcement progressif l’a incitée à persévérer sur le long terme, jusqu’à atteindre son objectif ultime : obtenir un diamant.

Mais pour compliquer encore un peu l’expérience, les chercheurs de DeepMind ont redémarré le monde Minecraft toutes les 30 minutes. Dreamer devait ainsi s’adapter à un environnement nouveau à chaque fois, sans jamais se reposer sur un monde connu.

Aussi rapide qu’un expert humain

Il aura fallu à Dreamer environ neuf jours de jeu en continu pour réussir à extraire son premier diamant. Un temps impressionnant pour une machine, surtout dans un environnement aussi riche et imprévisible que celui de Minecraft. À la fin de l’expérience, l’IA parvenait à atteindre son objectif en moins de 30 minutes, soit le même temps qu’un·e joueur·se expérimenté·e.

Illustration montrant une silhouette agenouillée dans un désert, tendant la main vers un diamant lumineux posé au sol, avec un temple en ruines à l’arrière-plan.
Après neuf jours d’apprentissage, Dreamer parvient à obtenir un diamant en moins de trente minutes, atteignant les performances d’un humain expert.

Selon Danijar Hafner, chercheur principal sur le projet, cette avancée représente bien plus qu’une simple victoire dans un jeu vidéo. « Dreamer constitue une avancée majeure vers des systèmes d’intelligence artificielle capables de généraliser leur apprentissage. Elle peut comprendre un environnement physique et progresser de manière autonome, sans qu’un humain lui dise exactement quoi faire. »

Un futur bien au-delà de Minecraft

Si Minecraft a servi de terrain d’expérimentation, c’est parce qu’il constitue un environnement particulièrement propice : riche, complexe, changeant et propice à la planification à long terme. Mais les implications de Dreamer vont bien au-delà de ce jeu.

Illustration montrant un robot humanoïde contemplant l’horizon dans un désert parsemé de blocs inspirés de Minecraft, avec un cube flottant au loin, baignant la scène d’une lumière surnaturelle.
L’avenir de l’IA imaginé par Dreamer dépasse les frontières du jeu : demain, elle pourrait interagir avec le monde réel comme elle l’a fait dans Minecraft.

En théorie, un tel système pourrait s’appliquer à des robots réels, capables d’apprendre à interagir avec le monde physique sans supervision constante. Que ce soit pour naviguer dans un entrepôt, effectuer des réparations ou même explorer des environnements hostiles, une IA capable de “rêver” les conséquences de ses actes pourrait révolutionner bien des domaines.

Une IA vraiment autonome

Ce qui distingue Dreamer des autres intelligences artificielles, c’est son autonomie totale. Là où les précédents systèmes avaient besoin de données humaines ou de scénarios prédéfinis, Dreamer apprend seule. Elle bâtit un modèle mental du monde qui l’entoure, explore, s’adapte, et surtout : généralise.

Sans aucune donnée humaine, Dreamer explore un monde inconnu et parvient seule à extraire un diamant, symbole d’un apprentissage entièrement autonome.
Sans aucune donnée humaine, Dreamer explore un monde inconnu et parvient seule à extraire un diamant, symbole d’un apprentissage entièrement autonome.

Dans un article publié dans la prestigieuse revue Nature, l’équipe de DeepMind souligne que Dreamer est, à leur connaissance, la première IA à avoir collecté un diamant dans Minecraft sans données humaines, sans tutoriels, sans “curriculum”. Une première mondiale, qui marque peut-être le début d’une nouvelle ère de l’intelligence artificielle.

4.4 / 5 - (7 votes)