Regardez les robots humanoïdes valtzing parfaitement avec les humains grâce à la mise à niveau du logiciel de suivi des mouvements de l'IA

Regardez les robots humanoïdes valtzing parfaitement avec les humains grâce à la mise à niveau du logiciel de suivi des mouvements de l’IA

Par Anissa Chauvin

Exbody2: Contrôle avancé de l’expressivité humanoïde – YouTube – YouTube

Surveiller

Les robots humanoïdes pourraient bientôt évoluer de manière beaucoup plus réaliste – et même danser comme nous – grâce à un nouveau cadre logiciel pour suivre le mouvement humain.

Développé par des chercheurs de UC San Diego, UC Berkeley, MIT et Nvidia, « EXBOD2 » est une nouvelle technologie qui permet aux robots humanoïdes d’effectuer des mouvements réalistes basés sur des analyses détaillées et des visualisations de mouvement des humains.

Les chercheurs espèrent que les futurs robots humanoïdes pourraient effectuer un éventail beaucoup plus large de tâches en imitant plus précisément les mouvements humains. Par exemple, la méthode d’enseignement pourrait aider les robots à fonctionner dans des rôles nécessitant des mouvements fins – tels que la récupération des articles des étagères – ou se déplacer avec soin des humains ou d’autres machines.

EXBODY2 fonctionne en prenant des mouvements simulés basés sur des scans de capture de mouvement des humains et en les traduisant en données de mouvement utilisables pour que le robot puisse reproduire. Le cadre peut reproduire les mouvements complexes en utilisant le robot, ce qui permettrait aux robots de se déplacer moins rigidement et à s’adapter à différentes tâches sans avoir besoin d’un recyclage étendu.

Tout cela est enseigné en utilisant l’apprentissage du renforcement, un sous-ensemble d’apprentissage automatique dans lequel le robot est nourri de grandes quantités de données pour s’assurer qu’elle prend la voie optimale dans une situation donnée. De bonnes sorties, simulées par les chercheurs, se voient attribuer des scores positifs ou négatifs pour « récompenser » le modèle de résultats souhaitables, ce qui signifiait ici reproduire les mouvements précisément sans compromettre la stabilité du bot.

Le cadre peut également prendre de courts clips de mouvement, tels que quelques secondes de danse et synthétiser de nouveaux cadres de mouvement pour référence, pour permettre aux robots de terminer les mouvements de plus longue durée.

Danser avec des robots

Dans un vidéo publiée sur youtubeun robot formé à travers des danses, des longerons et des exercices exbody2 aux côtés d’un sujet humain. De plus, le robot imite le mouvement d’un chercheur en temps réel, en utilisant un code supplémentaire intitulé « Hybrik: Hybrid Analytical-Neural Inverse Kinematics for Body Mesh Recovery » développé par le groupe de vision machine et d’intelligence de l’Université Shanghai Jiao Tong.

À l’heure actuelle, l’ensemble de données d’ExBody2 est largement axé sur les mouvements du haut du corps. Dans une étude, téléchargée le 17 décembre 2024 sur le serveur de préparation Arxivles chercheurs derrière le cadre ont expliqué que cela est dû aux préoccupations selon lesquelles l’introduction de trop de mouvement dans la moitié inférieure du robot provoquera l’instabilité.

« Les tâches trop simplistes pourraient limiter la capacité de la politique de formation à généraliser à de nouvelles situations, tandis que des tâches trop complexes pourraient dépasser les capacités opérationnelles du robot, conduisant à des résultats d’apprentissage inefficaces », ont-ils écrit. « Une partie de notre préparation de données de données comprend donc l’exclusion ou la modification des entrées qui comportaient des mouvements complexes du bas du corps au-delà des capacités du robot. »

L’ensemble de données des chercheurs contient plus de 2 800 mouvements, avec 1 919 d’entre eux provenant de l’archive de la capture de mouvement comme ensemble de données de forme de surface (AMASS). Il s’agit d’un grand ensemble de données de mouvements humains, y compris plus de 11 000 mouvements humains individuels et 40 heures de données de mouvement détaillées, destinées à un apprentissage en profondeur non commercial – lorsqu’un réseau neuronal est formé sur de grandes quantités de données pour identifier ou reproduire des modèles.

Ayant prouvé l’efficacité d’Exbody2 à reproduire le mouvement humain dans les robots humanoïdes, l’équipe se tournera désormais vers le problème de la réalisation de ces résultats sans avoir à organiser manuellement des ensembles de données pour garantir que seules des informations appropriées sont disponibles dans le cadre. Les chercheurs suggèrent que, à l’avenir, la collection de jeux de données automatisés aidera à lisser ce processus.

Anissa Chauvin