La nouvelle IA du MIT peut apprendre à contrôler les robots en regardant le monde à travers leurs yeux - il n'a besoin que d'une seule caméra

Les scientifiques du MIT ont développé une nouvelle vision basée intelligence artificielle (AI) Système qui peut enseigner lui-même comment contrôler pratiquement n’importe quel robot sans utiliser de capteurs ou de pré-formation.

Le système recueille des données sur l’architecture d’un robot donné à l’aide de caméras, de la même manière que les humains utilisent leurs yeux pour se renseigner sur eux-mêmes au fur et à mesure qu’ils se déplacent.

Cela permet au contrôleur AI de développer un modèle d’auto-apprentissage pour faire fonctionner n’importe quel robot – donnant essentiellement aux machines un sentiment humain de conscience de soi physique.

Les chercheurs ont réalisé cette percée en créant un nouveau paradigme de contrôle qui utilise des caméras pour cartographier un flux vidéo de « Visuomotor Jacobian Field d’un robot », une représentation des points 3D visibles de la machine, aux actionneurs du robot.

Le modèle AI peut alors prédire les mouvements de précision-moteur. Cela permet de transformer des architectures de robot non traditionnelles, telles que la robotique douce et celles conçues avec des matériaux flexibles, en unités autonomes avec seulement quelques heures de formation.

« Pensez à la façon dont vous apprenez à contrôler vos doigts: vous bougez, vous observez, vous vous adaptez », a expliqué Sizhe Lester Liun doctorant au MIT CSAIL et chercheur principal sur le projet, dans un communiqué de presse. « C’est ce que fait notre système. Il expérimente des actions aléatoires et détermine les contrôles déplacez les parties du robot. »

Les solutions de robotique typiques reposent sur l’ingénierie de précision pour créer des machines pour exiger des spécifications qui peuvent être contrôlées à l’aide de systèmes pré-formés. Ceux-ci peuvent nécessiter des capteurs coûteux et des modèles d’IA développés avec des centaines ou des milliers d’heures de réglage fin afin d’anticiper chaque permutation possible de mouvement. Des objets captivants avec des appendices manuels, par exemple, reste un défi difficile Dans les arènes de l’ingénierie des machines et du contrôle du système d’IA.

Comprendre le monde qui vous entoure

L’utilisation de la solution de caméra de cartographie « champ jacobien », en revanche, fournit une solution à faible coût et haute fidélité au défi de l’automatisation des systèmes de robots.

L’équipe a publié ses conclusions le 25 juin dans le journal Nature. Dans ce document, ils ont déclaré que le travail avait été conçu pour imiter la méthode du cerveau humain pour apprendre à contrôler les machines.

Notre capacité à apprendre et à reconstruire les configurations 3D et à prédire le mouvement en fonction du contrôle est dérivée de la vision seule. Selon le journal, «les gens peuvent apprendre à choisir et à placer des objets en quelques minutes» lors du contrôle des robots avec un contrôleur de jeu vidéo, et «les seuls capteurs dont nous avons besoin sont nos yeux».

Le cadre du système a été développé à l’aide de deux à trois heures de vidéos multi-visualités d’un robot exécutant des commandes générées de manière aléatoire capturées par 12 caméras vidéo RVB-D de qualité grand public.

Ce cadre est composé de deux composants clés. Le premier est un modèle d’apprentissage en profondeur qui permet essentiellement au robot de déterminer où elle et ses appendices sont dans un espace tridimensionnel. Cela lui permet de prédire comment sa position va changer à mesure que les commandes de mouvement spécifiques sont exécutées. Le second est un programme d’apprentissage automatique qui traduit les commandes de mouvement générique en code qu’un robot peut comprendre et exécuter.

L’équipe a testé le nouveau paradigme de formation et de contrôle en comparant son efficacité contre les méthodes de contrôle traditionnelles basées sur la caméra. La solution de terrain Jacobian a dépassé les systèmes de contrôle 2D existants en précision – en particulier lorsque l’équipe a introduit l’occlusion visuelle qui a fait entrer les méthodes plus anciennes dans un état d’échec. Les machines utilisant la méthode de l’équipe, cependant, ont créé avec succès des cartes 3D navigables même lorsque les scènes étaient partiellement occluses avec un encombrement aléatoire.

Une fois que les scientifiques ont développé le cadre, il a ensuite été appliqué à divers robots avec des architectures très variables. Le résultat final était un programme de contrôle qui ne nécessite aucune autre intervention humaine pour former et exploiter des robots en utilisant une seule caméra vidéo.

Anissa Chauvin

Je m'appelle Anissa, rédactrice passionnée au cœur battant pour Reveil Citoyen Media. Mon parcours, de la plume lycéenne aux salles de rédaction, est guidé par une curiosité insatiable et le désir ardent de révéler les vérités cachées. Chaque article que je rédige est une invitation à réfléchir, à questionner et, surtout, à agir pour un monde meilleur.

La nouvelle IA du MIT peut apprendre à contrôler les robots en regardant le monde à travers leurs yeux – il n’a besoin que d’une seule caméra

Comprendre le monde qui vous entoure