Les scientifiques de Meta ont utilisé l’intelligence artificielle (IA) et les analyses cérébrales non invasives pour démêler comment les pensées sont traduites en phrases dactylographiées, selon deux nouvelles études.
Dans une étude, les scientifiques ont développé un modèle d’IA qui signaux cérébraux décodés pour reproduire des phrases tapées par des bénévoles. Dans le deuxième étudeles mêmes chercheurs ont utilisé l’IA pour cartographier la façon dont le cerveau produit réellement la langue, transformant les pensées en phrases dactylographiées.
Les résultats pourraient un jour soutenir une interface cérébrale non invasive qui pourrait aider les personnes ayant des lésions cérébrales ou des blessures à communiquer, ont déclaré les scientifiques.
« Ce fut une véritable étape dans le décodage, en particulier avec le décodage non invasif » » Alexander Huthun neuroscientifique informatique de l’Université du Texas à Austin qui n’a pas été impliqué dans la recherche, a déclaré à Live Science.
Les interfaces cérébrales qui utilisent des techniques de décodage similaires ont été implantées dans le cerveau de personnes qui ont perdu la capacité de communiquer, mais les nouvelles études pourraient soutenir un chemin potentiel vers des appareils portables.
Dans la première étude, les chercheurs ont utilisé une technique appelée magnétoencéphalographie (MEG), qui mesure le champ magnétique créé par des impulsions électriques dans le cerveau, pour suivre l’activité neuronale pendant que les participants ont tapé des phrases. Ensuite, ils ont formé un modèle de langue AI pour décoder les signaux cérébraux et reproduire les phrases des données MEG.
Le modèle a décodé les lettres que les participants ont tapées avec une précision de 68%. Des lettres fréquemment provoquées ont été décodées correctement plus souvent, tandis que des lettres moins courantes, comme Z et K, sont livrées avec des taux d’erreur plus élevés. Lorsque le modèle a fait des erreurs, il avait tendance à substituer des caractères qui étaient physiquement proches de la lettre cible sur un clavier QWERTY, suggérant que le modèle utilise des signaux motrices du cerveau pour prédire quelle lettre a tapé un participant.
La deuxième étude de l’équipe s’est appuyée sur ces résultats pour montrer comment la langue est produite dans le cerveau pendant qu’une personne tape. Les scientifiques ont collecté 1 000 MEG Snapshots par seconde alors que chaque participant a tapé quelques phrases. À partir de ces instantanés, ils ont décodé les différentes phases de la production de phrases.
Décoder vos pensées avec l’IA
Ils ont constaté que le cerveau génère d’abord des informations sur le contexte et la signification de la phrase, puis produit des représentations de plus en plus granulaires de chaque mot, syllabe et lettre comme les types de participants.
« Ces résultats confirment les prédictions de longue date que la production de langage nécessite une décomposition hiérarchique de la signification des phrases en unités progressivement plus petites qui contrôlent finalement les actions motrices », ont écrit les auteurs dans l’étude.
Pour empêcher la représentation d’un mot ou d’une lettre d’interférer avec le suivant, le cerveau utilise un « code neuronal dynamique » pour les séparer, a constaté l’équipe. Ce code se déplace constamment lorsque chaque élément d’information est représenté dans les parties productrices de langue du cerveau.
Cela permet au cerveau de lier des lettres, des syllabes et des mots successifs tout en conservant des informations sur chacune sur des périodes plus longues. Cependant, les expériences MEG n’ont pas été en mesure de déterminer exactement où dans ces régions du cerveau, chacune de ces représentations de la langue se produit.
Ensemble, ces deux études, qui n’ont pas encore été évaluées par des pairs, pourraient encore aider les scientifiques à concevoir des dispositifs non invasifs qui pourraient améliorer la communication chez les personnes qui ont perdu la capacité de parler.
Bien que la configuration actuelle soit trop volumineuse et trop sensible pour fonctionner correctement en dehors d’un environnement de laboratoire contrôlé, les progrès de la technologie MEG peuvent ouvrir la porte à de futurs appareils portables, ont écrit les chercheurs.
« Je pense qu’ils sont vraiment à la pointe des méthodes ici », a déclaré Huth. « Ils font certainement autant que nous pouvons le faire avec la technologie actuelle en termes de ce qu’ils peuvent retirer de ces signaux. »