Dans le film de science-fiction Arrival de 2016, un linguiste est confronté à la tâche ardue de déchiffrer un étranger langage composé de phrases palindromiques, qui se lisent de la même manière à l’envers qu’à l’avant, écrites avec des symboles circulaires. Au fur et à mesure qu’elle découvre divers indices, différentes nations du monde interprètent les messages différemment – certains supposant qu’ils véhiculent une menace.
Si l’humanité se retrouvait aujourd’hui dans une telle situation, notre meilleure chance serait peut-être de nous tourner vers la recherche pour découvrir comment intelligence artificielle (IA) développe des langages.
Mais qu’est-ce qui définit exactement une langue ? La plupart d’entre nous en utilisent au moins un pour communiquer avec les gens autour de nous, mais comment est-ce arrivé ? Les linguistes réfléchissent cette même question depuis des décenniesmais il n’y a pas de moyen facile pour découvrir comment la langue a évolué.
Le langage est éphémère, il ne laisse aucune trace examinable dans les archives fossiles. Contrairement aux os, nous ne pouvons pas déterrer les langues anciennes pour étudier leur évolution au fil du temps.
Même si nous ne sommes peut-être pas en mesure d’étudier la véritable évolution du langage humain, une simulation pourrait peut-être fournir quelques indications. C’est là qu’intervient l’IA : un domaine de recherche fascinant appelé communication émergenteque j’ai passé les trois dernières années à étudier.
Pour simuler l’évolution du langage, nous confions aux agents (IA) des tâches simples qui nécessitent une communication, comme un jeu dans lequel un robot doit en guider un autre vers un emplacement spécifique sur une grille sans lui montrer de carte. Nous n’imposons (presque) aucune restriction sur ce qu’ils peuvent dire ou comment – nous leur confions simplement la tâche et les laissons la résoudre comme ils le souhaitent.
Parce que la résolution de ces tâches nécessite que les agents communiquent entre eux, nous pouvons étudier comment leur communication évolue au fil du temps pour avoir une idée de la façon dont le langage pourrait évoluer.
Similaire des expériences ont été faites avec des humains. Imaginez que vous, un anglophone, soyez jumelé à un non-anglophone. Votre tâche consiste à demander à votre partenaire de ramasser un cube vert parmi un assortiment d’objets sur une table.
Vous pouvez essayer de montrer une forme de cube avec vos mains et de pointer l’herbe à l’extérieur de la fenêtre pour indiquer la couleur verte. Au fil du temps, vous développeriez ensemble une sorte de proto-langage. Peut-être créeriez-vous des gestes ou des symboles spécifiques pour « cube » et « vert ». Grâce à des interactions répétées, ces signaux improvisés deviendraient plus raffinés et cohérents, formant ainsi un système de communication de base.
Cela fonctionne de la même manière pour l’IA. À travers essais et erreurs, ils apprennent pour communiquer sur les objets qu’ils voient, et leurs interlocuteurs apprennent à les comprendre.
Mais comment savoir de quoi ils parlent ? S’ils développent ce langage uniquement avec leur interlocuteur artificiel et non avec nous, comment savons-nous ce que signifie chaque mot ? Après tout, un mot spécifique pourrait signifier « vert », « cube » ou pire, les deux. Ce défi d’interprétation est un élément clé de mes recherches.
Déchiffrer le code
La tâche consistant à comprendre le langage de l’IA peut sembler presque impossible au premier abord. Si j’essayais de parler polonais (ma langue maternelle) à un collaborateur qui ne parle que l’anglais, nous ne pourrions pas nous comprendre ni même savoir où commence et se termine chaque mot.
Le défi avec les langages de l’IA est encore plus grand, car ils pourraient organiser l’information d’une manière totalement étrangère aux modèles linguistiques humains.
Heureusement, les linguistes ont développé sophistiqué outils utiliser la théorie de l’information pour interpréter des langues inconnues.
Tout comme les archéologues reconstituent des langues anciennes à partir de fragments, nous utilisons des modèles dans les conversations de l’IA pour comprendre leur structure linguistique. Parfois on trouve des similitudes surprenantes aux langues humaines, et d’autres fois nous découvrons des moyens de communication entièrement nouveaux.
Ces outils nous aident à jeter un coup d’œil dans la « boîte noire » de la communication de l’IA, révélant comment les agents artificiels développent leurs propres façons uniques de partager des informations.
Mes travaux récents portent sur l’utilisation de ce que les agents voient et disent pour interpréter leur langage. Imaginez avoir la transcription d’une conversation dans une langue que vous ne connaissez pas, ainsi que ce que chaque intervenant regardait. Nous pouvons faire correspondre les modèles de la transcription aux objets dans le champ de vision du participant, établissant ainsi des liens statistiques entre les mots et les objets.
Par exemple, peut-être que l’expression « yayo » coïncide avec un oiseau qui passe devant – nous pourrions deviner que « yayo » est le mot utilisé par l’orateur pour « oiseau ». Grâce à une analyse minutieuse de ces modèles, nous pouvons commencer à décoder le sens de la communication.
Dans le dernier article par moi et mes collègues, qui figureront dans les actes de la conférence de Neural Information Processing Systems (NeurIPS), nous montrons que de telles méthodes peuvent être utilisées pour procéder à une ingénierie inverse d’au moins certaines parties du langage et de la syntaxe des IA, nous donnant ainsi un aperçu de la manière dont elles pourrait structurer la communication.
Aliens et systèmes autonomes
Quel est le lien avec les extraterrestres ? Les méthodes que nous développons pour comprendre les langages de l’IA pourraient nous aider à déchiffrer toute future communication extraterrestre.
Si nous parvenons à obtenir un texte étranger écrit accompagné d’un certain contexte (comme des informations visuelles relatives au texte), nous pourrions appliquer les mêmes outils statistiques pour les analyser. Les approches que nous développons aujourd’hui pourraient constituer des outils utiles dans l’étude future des langues étrangères, connue sous le nom de xénolinguistique.
Mais nous n’avons pas besoin de trouver des extraterrestres pour bénéficier de ces recherches. Il y a de nombreuses applicationsdepuis améliorer les modèles de langage comme ChatGPT ou Claude pour améliorer la communication entre véhicules autonomes ou drones.
En décodant les langages émergents, nous pouvons rendre les technologies futures plus faciles à comprendre. Qu’il s’agisse de savoir comment les voitures autonomes coordonnent leurs mouvements ou comment les systèmes d’IA prennent des décisions, nous ne créons pas seulement des systèmes intelligents : nous apprenons à les comprendre.
Cet article édité est republié à partir de La conversation sous licence Creative Commons. Lire le article original.