A four-legged robot with a single long arm plays badminton against a researcher

Les scientifiques ont enseigné à un «chien robot» alimenté par AI comment jouer au badminton contre les humains – et c’est vraiment très bien

Par Anissa Chauvin

Les scientifiques ont formé un robot à quatre pattes pour jouer au badminton contre un adversaire humain, et il se précipite sur le terrain pour jouer des rassemblements pouvant aller jusqu’à 10 tirs.

En combinant des mouvements du corps entier avec une perception visuelle, le robotappelé « Anymal« a appris à adapter la façon dont il s’est déplacé pour atteindre le navette et le renvoyer avec succès sur le net, grâce à intelligence artificielle (Ai).

Cela montre que des robots à quatre pattes peuvent être construits en tant qu’adversaires dans des « scénarios sportifs complexes et dynamiques », ont écrit les chercheurs dans une étude publiée le 28 mai dans la revue Robotique scientifique.

Anymal est un robot à quatre pattes en forme de chien qui pèse 110 livres (50 kilogrammes) et mesure environ 1,5 pieds (0,5 mètre) de hauteur. Avoir quatre jambes permet à AnyMal et Robots à quadruples similaires se déplacer sur un terrain difficile et Montez les obstacles de haut en bas.

Les chercheurs ont déjà ajouté des armes à ces machines en forme de chien et leur ont appris à récupérer des objets particuliers ou portes ouvertes en saisissant la poignée. Mais la coordination du contrôle des membres et de la perception visuelle dans un environnement dynamique reste un défi dans la robotique.

« Le sport est une bonne application pour ce type de recherche car vous pouvez progressivement augmenter la compétitivité ou la difficulté », co-auteur de l’étude Yuntao maun chercheur en robotique précédemment chez Eth Zürich et maintenant avec la startup Light Robotics, a déclaré à Live Science.

Enseigner à un nouveau chien de nouvelles astuces

Dans cette recherche, MA et son équipe ont attaché un bras dynamique tenant une raquette de badminton à un angle de 45 degrés sur le robot standard Anymal.

Avec l’ajout du bras, le robot se tenait 5 pieds, 3 pouces (1,6 m) de hauteur et avait 18 articulations: trois sur chacune des quatre jambes et six sur le bras. Les chercheurs ont conçu un système intégré complexe qui contrôlait les mouvements des bras et des jambes.

L’équipe a également ajouté une caméra stéréo, qui avait deux lentilles empilées les unes sur les autres, juste à droite du centre sur le devant du corps du robot. Les deux objectifs lui ont permis de traiter des informations visuelles sur les navettes entrantes en temps réel et de déterminer où ils se dirigeaient.

Le robot a ensuite appris à devenir un joueur de badminton à travers apprentissage du renforcement. Avec ce type d’apprentissage automatique, le robot a exploré son environnement et a utilisé des essais et des erreurs pour apprendre à repérer et à suivre la navette, à naviguer vers lui et à balancer la raquette.

Pour ce faire, les chercheurs ont d’abord créé un environnement simulé composé d’un tribunal de badminton, avec le homologue virtuel du robot dans le centre. Les navettes virtuelles ont été desservies près du centre de la moitié de la Cour de l’adversaire, et le robot a été chargé de suivre sa position et d’estimer sa trajectoire de vol.

Ensuite, les chercheurs ont créé un régime d’entraînement strict pour enseigner à Anymal comment frapper les volants, avec un entraîneur virtuel récompensant le robot pour une variété de caractéristiques, y compris la position de la raquette, l’angle de la tête de la raquette et la vitesse de la balançoire. Surtout, les récompenses de swing étaient basées sur le temps pour inciter les coups sûrs et opportuns.

La navette pourrait atterrir n’importe où sur le terrain, de sorte que le robot a également été récompensé s’il se déplaçait efficacement sur le terrain et s’il ne s’accélère pas inutilement. L’objectif d’Anymal était de maximiser la quantité de récompense dans tous les essais.

Sur la base de 50 millions d’essais de cette formation de simulation, les chercheurs ont créé un réseau neuronal qui pourrait contrôler le mouvement des 18 articulations pour se diriger vers et frapper la navette.

Un apprenant rapide

Après les simulations, les scientifiques ont transféré le réseau neuronal dans le robot, et Anymal a été mis à l’épreuve dans le monde réel.

Ici, le robot a été formé pour trouver et suivre une navette à orange brillant desservi par une autre machine, ce qui a permis aux chercheurs de contrôler la vitesse, les angles et les lieux d’atterrissage des navettes. AnyMal a dû se précipiter sur le terrain pour frapper la navette à une vitesse qui le rendrait sur le filet et au centre du tribunal.

Les chercheurs ont constaté que, après une formation approfondie, le robot pouvait suivre les navettes et les retourner avec précision avec des vitesses de swing jusqu’à environ 39 pieds par seconde (12 mètres par seconde) – environ la moitié de la vitesse de balançoire d’un joueur de badminton amateur humain moyen, ont noté les chercheurs.

Anymal a également ajusté ses modèles de mouvement en fonction de la distance à laquelle il a dû se rendre à la navette et combien de temps il devait l’atteindre. Le robot n’avait pas besoin de voyager lorsque la navette ne devait atterrir qu’à quelques mètres (demi-mètre), mais à environ 5 pieds (1,5 m), Anymal s’est précipité pour atteindre la navette en déplaçant les quatre jambes. À environ 7 pieds (2,2 m) de distance, le robot a galopé vers la navette, produisant une période d’élévation qui a étendu la portée du bras de 3 pieds (1 m) en direction de la cible.

« Le contrôle du robot pour regarder la volonté n’est pas si trivial », a déclaré Ma. Si le robot regarde la navette, il ne peut pas se déplacer très rapidement. Mais si cela ne semble pas, il ne saura pas où il doit aller. « Ce compromis doit se produire d’une manière quelque peu intelligente », a-t-il déclaré.

Ma a été surpris par la façon dont le robot a compris comment déplacer les 18 articulations de manière coordonnée. C’est une tâche particulièrement difficile car le moteur de chaque articulation apprend indépendamment, mais le mouvement final les oblige à travailler en tandem.

L’équipe a également constaté que le robot avait spontanément commencé à retourner au centre du terrain après chaque coup, semblable à la façon dont les joueurs humains se préparent à des navettes entrantes.

Cependant, les chercheurs ont noté que le robot ne considérait pas les mouvements de l’adversaire, ce qui est une manière importante pour les acteurs humains prédise les trajectoires de navette. Y compris les estimations de la pose humaine aiderait à améliorer les performances d’Anymal, a déclaré l’équipe dans l’étude. Ils pourraient également ajouter un joint de cou pour permettre au robot de surveiller la navette pendant plus de temps, a noté Ma.

Il pense que cette recherche aura finalement des applications au-delà du sport. Par exemple, il pourrait soutenir l’élimination des débris pendant les efforts de secours en cas de catastrophe, a-t-il dit, car le robot serait en mesure d’équilibrer la perception visuelle dynamique avec un mouvement agile.

Anissa Chauvin