France
This article was added by the user . TheWorldNews is not responsible for the content of the platform.

Comment l'intelligence artificielle a appris à jouer à Minecraft à partir de 70 000 heures de vidéos YouTube

Nouveau succès d'OpenAI. Une société spécialisée dans l'intelligence artificielle a montré qu'en bourrant l'IA de vidéo, vous pouvez entraîner l'IA à jouer correctement à des jeux vidéo complexes. Un grand pas en avant dans le machine learning 

L'intelligence artificielle pourra un jour jouer à Minecraft mieux ou mieux que les humains Et surtout, elle pourra bientôt apprendre beaucoup plus vite grâce à une simple vidéo publiée sur le web C'est le but d'OpenAI, qui vient tout de même de présenter des premiers résultats de recherche prometteurs.

MaîtriserMinecraftest un grand défi pour l'intelligence artificielle. Le titre de Mojang vient du fait que c'est un jeu beaucoup plus complexe à assimiler à un ordinateur que les échecs ou le go (un jeu où l'IA nous atomise désormais). C'est un jeu très ouvert avec des règles flexibles qui le rendent très attractif  exploration,crafter, creuser et construire librement des joueurs Il offre une liberté presque totale de ... Bref, de malheureux programmes informatiques se connectent actions très diverses et complexes qui sont difficiles à apprendre.

Mais c'est ce qu'a fait une équipe de chercheurs d'OpenAI. Ils ont formé leurs modèles à partir de zéro...Minecraft peut jouer " Correctement " Surtout, leurs modèles sont exactement comme les humains Il sera joué. Interface et commandes du jeu  : frappes au clavier et mouvements de la souris.

Mettons-nous d'accord  :Lâchée dans Minecraft, l'intelligence artificielle d'OpenAI ne peut pas construire une maison de rêve à partir de zéro.Sans parler de la recréation de King's LandingC'est une tâche beaucoup plus modeste, mais ses performances ne sont pas ridicules. De cette façon, elle a réussi à construire un abri de base, à construire des outils et à explorer le village pour ouvrir son coffre... elle a été la première pioche en diamant au monde, selon OpenAI. J'ai même pu créer. C'est certainement loin d'être un outil facile à obtenir et nécessite de nombreuses étapes complexes d'exploration, de fabrication et de combinaison d'objets.

L'IA pour jouer à Minecraft, c'est tout

L'IA alimentée sur YouTube

Comment les chercheurs d'OpenAI sont-ils parvenus à de tels résultats ? La réponse peut être résumée en presque un mot  : YouTube. Ils ont profité de l'incroyable richesse et variété des vidéosMinecraftsur Internet pour " gaver " le modèle.

Bien sûr, ce n'est pas si simple. C'est loin de là. Leur technique, qu'ils ont baptisée VPT (Video PreTraining), consistait initialement à collecter 70 000 heures (.) de vidéo de jeu. Ce n'est plus simple  : pour cela, les chercheurs ont dû s'appuyer sur la " petite main " adoptée par Amazon Mechanical Turk. Ils ont utilisé des captures d'écran de chaque vidéo pour voir si le contenu sélectionné était réellement disponible pour le projet, sur la base d'un corpus de départ de 270 000 heures 
Par exemple, en mode créatif ou en mode A contenant des logos et des artefacts pouvant nuire à la compréhension de la machine.
Enfin, une petite subtilité : pour faciliter le début du jeu du bébé, les chercheurs ont également extrait un sous-ensemble de ces milliers de vidéos qui ne contenaient que le début du jeu.

Mieux encore, les chercheurs ne se sont pas arrêtés là  : ilsMinecraft {modèle vidéo de 50 secondes séries(Inverse Dynamics Model, IDM) ont également créé Ceci est un corpus beaucoup plus petit (seulement 2000 heures), mais avec l'avantage d'être très précis. Toutes ces pièces sont spécialement créées pour l'expérience des joueursMinecraftexpérimentés. Par conséquent, les chercheurs ont pu enregistrer chaque mouvement de la souris et chaque opération effectuée sur le clavier.

modèle OpenAI pour Minecraft
Première étape de la formation // Crédits  : OpenAI

Ensuite, ils ont essentiellement collecté 70 000 heures auparavant. J'ai appliqué ce modèle à la vidéo sur le Web. . De cette façon, leur IA a pu " deviner " les mouvements de souris et de clavier effectués dans ces vidéos et en tirer des leçons. Je suis intelligente.

Après avoir été entraîné de cette manière, l'IA a déjà coupé du bois en bûches, puis en planches, puis en utilisant latable de bricolage, etc. Vous pourrez effectuer diverses Tâches. 4 planches. Bien sûr, c'est une étape triviale pour les joueurs humains, mais selon OpenAI, cela peut difficilement être réalisé avec un simple apprentissage par renforcement.

C'est bien, mais pas assez

C'est déjà bien, mais pas assez pour nos chercheurs. Ils ont donc essayé de modifier l'IA pour leur donner plus decompétencesen utilisant avec succès deux techniques différentes. Tout d'abord, ils ont demandé à un expert humain deMinecraftd'organiser une session de 10 minutes visant à construire une petite maison à partir de matériaux de base.
J'ai réalisé qu'en intégrant ces pièces dans le modèle, l'IA pouvait non seulement créer un abri modeste à elle seule, mais aussi créer des objets plus complexes (comme une pioche en pierre).

Enfin, ils ont également utilisé l'apprentissage par renforcement, exigeant que l'IA obtienne une pioche en diamant en 10 minutes de jeu sur une carte vierge, et ont récompensé cet effort. Ce n'est pas facile. En effet, vous devez collecter, combiner et créer un long ensemble dequi n'est pas facile à trouver successivement. Mais j'ai quand même pu le faire plusieurs fois. C'est-à-dire que 2,5   % de la partie de 10 minutes ont été joués.

Mais pourquoi enseigner Minecraft à l'IA 

De toute évidence, OpenAI fait cela pour créer " Superman " Je n'ai pas tout fait. De "àMinecraft. Pourtant, le chercheur estime qu'un million d'heures de jeu peuvent être collectées pour compléter le modèle. Non, le VPT est avant tout une scène humaine. Il peut ouvrir la voie à de nouvelles façons d'enseigner à l'IA " l'action ".

" Les résultats présentés dans ce livre blanc aident à ouvrir la voie à l'utilisation d'une multitude de données non étiquetées sur le Web pour les domaines de décision séquentiels. "peut être lu dans la conclusion de l'article scientifique d'OpenAI.

Pour mieux comprendre cette phrase plutôt ennuyeuse, concentrons-nous sur Photoshop, laissantMinecraft. Avec des milliers de tutoriels Photoshop disponibles sur le Web, vous pouvez imaginer une intelligence artificielle similaire formée au VPT. Il apprend à naviguer, à cliquer, à appliquer des filtres et à retoucher des photos dans le menu de l'application. C'est le travail de certains graphistes 

Source : OpenAI