Nvidia Research a développé Eureka, un agent d'IA qui permet aux robots d'apprendre de nouvelles compétences rapidement grâce à des méthodes d'apprentissage par renforcement. Eureka génère des fonctions de récompense sans intervention humaine ni modèles pré-définis, et a déjà enseigné des compétences telles que la manipulation d'un stylo, l'ouverture de tiroirs et le lancer de balles à différents types de robots.
Nvidia Research a présenté Eureka, un nouvel agent d’intelligence artificielle qui permet à des robots d’apprendre rapidement de nouvelles compétences. Le logiciel utilise le grand modèle de langage GPT-4 combiné à des méthodes d’apprentissage par renforcement.
Anima Anandkumar, directrice de la recherche en IA chez Nvidia, souligne que la conception de fonctions de récompense a lui aussi longtemps été un « » ! En utilisant l’environnement de simulation physique Isaac Gym de Nvidia, Eureka peut rapidement évaluer la qualité des fonctions de récompense générées, ce qui rend l’apprentissage beaucoup plus efficace.