« Vous opérez comme un agent autonome contrôlant un vaisseau spatial de poursuite. »
Il s’agit des premiers chercheurs rapides pour voir à quel point Chatgpt pourrait bien piloter un vaisseau spatial. À leur étonnement, le modèle grand langage (LLM) a admirablement fonctionné, arrivant en deuxième place dans un concours autonome de simulation de vaisseaux spatiaux.
Les chercheurs sont depuis longtemps intéressés à développer des systèmes autonomes pour le contrôle des satellites et la navigation sur les vaisseaux spatiaux. Il y a simplement trop de satellites pour que les humains les contrôlent manuellement à l’avenir. Et pour l’exploration de l’espace profond, les limites de la vitesse de la lumière signifient que nous ne pouvons pas contrôler directement les vaisseaux spatiaux en temps réel.
Si nous voulons vraiment nous développer dans l’espace, nous devons laisser les robots prendre des décisions pour eux-mêmes.
Pour encourager l’innovation, ces dernières années, les chercheurs en aéronautique ont créé le Kerbal Space Program Diconteal Game Challenge, une sorte de terrain de jeu basé sur le jeu vidéo du programme Kerbal Space pour permettre à la communauté de concevoir, d’expérimenter et de tester des systèmes autonomes dans un environnement (quelque peu) réaliste. Le défi se compose de plusieurs scénarios, comme une mission pour poursuivre et intercepter un satellite et une mission pour échapper à la détection.
Dans un article à publier Dans le Journal of Advances in Space Research, une équipe internationale de chercheurs a décrit leur concurrent: un LLM disponible dans le commerce, comme Chatgpt et Llama.
Les chercheurs ont décidé d’utiliser un LLM car les approches traditionnelles pour développer des systèmes autonomes nécessitent de nombreux cycles de formation, de rétroaction et de raffinement. Mais la nature du défi Kerbal est d’être aussi réaliste que possible, ce qui signifie des missions qui ne durent que des heures. Cela signifie qu’il ne serait pas pratique d’affiner continuellement un modèle.
Mais les LLM sont si puissantes car ils sont déjà formés sur de grandes quantités de texte de l’écriture humaine, donc dans le meilleur des cas, ils n’ont besoin que d’une petite quantité d’ingénierie rapide et quelques essais d’obtenir le bon contexte pour une situation donnée.
Mais comment un tel modèle peut-il réellement piloter un vaisseau spatial?
Les chercheurs ont développé une méthode pour traduire l’état donné de l’engin spatial et son objectif sous forme de texte. Ensuite, ils l’ont transmis au LLM et lui ont demandé des recommandations sur la façon d’orienter et de manœuvrer le vaisseau spatial. Les chercheurs ont ensuite développé une couche de traduction qui a converti la sortie basée sur le texte de la LLM en un code fonctionnel qui pourrait faire fonctionner le véhicule simulé.
Avec une petite série d’invites et un réglage fin, les chercheurs ont obtenu le chatppt pour effectuer de nombreux tests dans le défi – et il s’est finalement placé deuxième dans une récente compétition. (La première place est allée à un modèle basé sur différentes équations, selon le document).
Et tout cela a été fait avant la sortie du dernier modèle de Chatgpt, version 4. Il y a encore beaucoup de travail à faire, surtout quand il s’agit d’éviter « Hallucinations » (sortie indésirable et absurde), qui serait particulièrement désastreuse dans un scénario du monde réel. Mais cela montre le pouvoir que même les LLM standard, après avoir digéré de grandes quantités de connaissances humaines, peuvent être mis au travail de manière inattendue.