Le concours MineRL a demandé à des équipes de chercheurs de créer des IA capables de trouver et de miner du diamant dans Minecraft de manière indépendante. La plupart des joueurs peuvent mener à bien cette tâche en quelques heures, voire moins pour les plus expérimentés. Mais qu’en est-il pour une intelligence artificielle ? Il semblerait que ce soit une tâche plutôt ardue, car aucune n’a réussi à relever le défi.
Au cours de l’été, Microsoft et d’autres organisations ont mis au défi des codeurs de créer des IA qui pourraient trouver des diamants seules. Mais sur les 660 participations du concours, aucune n’a pu relever le défi. Bien que les robots aient pu apprendre les étapes intermédiaires, comme la construction d’un four pour fabriquer des pioches durables, aucun n’a réussi à trouver un diamant.
“La tâche que nous avons posée est très difficile“, a déclaré à BBC News Katja Hofmann, chercheuse chez Microsoft Research, qui a aidé à organiser le défi. “Bien qu’aucun agent soumis n’ait complètement résolu la tâche, ils ont beaucoup progressé et a appris à créer bon nombre des outils nécessaires en cours de route.’
Cela peut être une surprise, surtout sachant que certaines IA ont réussi à vaincre des humains dans des jeux comme les échecs, le Go ou encore Dota 2. Mais ça reflète bien les limites de la technologie ainsi que les restrictions mises en place par les juges de MineRL pour mettre les équipes dans ces conditions de développement réelles.
Les IA de MineRL ont dû apprendre en utilisant une combinaison des méthodes appelées “apprentissage par imitation” (imitation learning) et “apprentissage par renforcement” (reinforcement learning). Dans l’apprentissage par imitation, les IA reçoivent des données sur la tâche qui les attend et essaient de l’imiter. Dans l’apprentissage par renforcement, elles sont simplement jetées dans un monde virtuel et laissées à eux-mêmes en apprenant via leurs essais et erreurs par répétition.
Souvent, l’IA ne peut relever de grands défis qu’en combinant ces deux méthodes. Le célèbre système AlphaGo, par exemple, a d’abord appris à jouer au Go en se nourrissant des données d’anciens jeux. Il a ensuite perfectionné ses compétences – et dépassé tous les humains – en jouant encore et encore.
Les robots de MineRL ont adopté une approche similaire, mais les ressources à leur disposition étaient relativement limitées. Alors que les IA comme celles d’AlphaGo sont créés avec d’énormes ensembles de données, un matériel informatique puissant et l’équivalent de décennies de formation, les robots MineRL ont dû se contenter de seulement 1000 heures de jeu enregistré pour apprendre, un seul processeur graphique Nvidia pour s’entraîner, et seulement quatre jours pour se mettre en place.
Il peut sembler injuste d’entraver les robots de MineRL de cette manière, mais ces contraintes reflètent les défis de l’intégration de l’IA dans le monde réel. Alors que les robots comme AlphaGo repoussent certainement les limites de l’IA, très peu d’entreprises et de laboratoires de recherche peuvent égaler les ressources de DeepMind, propriété de Google.
L’organisateur principal du concours, William Guss, étudiant doctorant à l’Université Carnegie Mellon, a déclaré à BBC News que le défi visait à montrer que tous les problèmes d’IA ne devaient pas être résolus en y injectant de la puissance de calcul. Cet état d’esprit, a déclaré Guss, “va directement à l’encontre de la démocratisation de l’accès à ces systèmes d’apprentissage par renforcement, et laisse la capacité de former des IAdans des environnements complexes aux entreprises disposant de vastes étendues de calcul.“
Ainsi, même si une IA se retrouve en difficulté face à Minecraft aujourd’hui, quand elle relèvera ce défi, elle devrait, espérons-le, offrir plus d’avantages à un public plus large.
Demander à aypierre la prochaine fois 😁.