Cube and neon lines in 3d space.

Les ordinateurs ne peuvent normalement pas voir les illusions d’optique, mais un scientifique a combiné l’IA avec la mécanique quantique pour y parvenir

Par Anissa Chauvin



Un nouveau intelligence artificielle (IA) peut imiter pour la première fois la façon dont les gens interprètent des illusions d’optique complexes, grâce à des principes empruntés aux lois de la mécanique quantique.

Illusions d’optiquecomme le Cube de cou et Vase de Rubinincitent le cerveau à voir d’abord une interprétation, puis une autre, au fur et à mesure que l’image est étudiée. Le cerveau humain bascule effectivement entre deux ou plusieurs versions différentes de ce qui est possible, même si l’image reste statique.

Cependant, la vision par ordinateur ne peut pas simuler les aspects psychologiques et neurologiques de la vision humaine et a du mal à imiter nos capacités de reconnaissance de formes naturellement développées. Les agents d’IA les plus avancés aujourd’hui ont donc du mal à voir les illusions d’optique comme le font les humains.

Mais une nouvelle étude publiée le 22 août dans la revue Apprentissage automatique APL a démontré une technique qui permet à une IA d’imiter la façon dont un cerveau humain interprète une illusion d’optique, en utilisant le phénomène physique du « tunnel quantique ».

Le système d’IA est surnommé « réseau neuronal profond à tunnel quantique » et combine les réseaux de neurones avec le tunnel quantique. Un réseau neuronal profond est un ensemble d’algorithmes d’apprentissage automatique inspirés de la structure et du fonctionnement du cerveau, avec plusieurs couches de nœuds entre l’entrée et la sortie. Il peut modéliser des relations non linéaires complexes et, contrairement aux réseaux de neurones conventionnels (qui incluent une seule couche entre l’entrée et la sortie), les réseaux de neurones profonds comprennent de nombreuses couches cachées.

L’effet tunnel quantique, quant à lui, se produit lorsqu’une particule subatomique, telle qu’un électron ou un photon (particule de lumière), traverse effectivement une barrière impénétrable. Parce qu’une particule subatomique comme la lumière peut également se comporter comme une onde – lorsqu’elle n’est pas directement observée, elle ne se trouve dans aucun endroit fixe – elle a une probabilité faible mais finie de se trouver de l’autre côté de la barrière. Lorsqu’un nombre suffisant de particules subatomiques sont présentes, certaines « tunnelisent » à travers la barrière.

Une fois que les données représentant l’illusion d’optique ont traversé l’étape de tunneling quantique, l’image légèrement modifiée est traitée par un réseau neuronal profond.

Le nouveau modèle d’IA a été entraîné à plusieurs reprises sur des illusions d’optique – le cube de Necker et le vase de Rubin – pour interpréter ce qu’il pouvait voir. En perturbant légèrement l’image à chaque fois qu’elle passait par l’étape de tunnel quantique, de petites différences ont été introduites. Le réseau neuronal profond a ensuite pris une décision sur la manière d’interpréter l’image.

Le réseau neuronal profond traite de multiples variations de l’illusion d’optique, en choisissant à laquelle des perspectives elle correspond. Cela lui permet d’imiter la façon dont un cerveau humain passe d’une perspective à l’autre lorsqu’il visualise une illusion d’optique.

« Lorsque nous voyons une illusion d’optique avec deux interprétations possibles (comme le cube ambigu ou le vase et les visages), les chercheurs pensent que nous maintenons temporairement les deux interprétations en même temps, jusqu’à ce que notre cerveau décide quelle image doit être vue. Cette situation ressemble à l’illusion quantique. -expérience de pensée mécanique de Le chat de Schrödinger« , a écrit l’auteur de l’étude Ivan Maksymovchercheur principal en IA à l’Université Charles Sturt en Australie, dans un publier sur TechXplore.

« J’ai entraîné mon réseau neuronal de tunnel quantique à reconnaître les illusions du cube de Necker et du vase de Rubin. Face à l’illusion comme entrée, il a produit une sortie de l’une ou l’autre des deux interprétations », a déclaré Maksymov.

Maksymov déclare que les résultats pourraient aider les pilotes de ligne à prendre conscience des dangers de désorientation et d’interprétation erronée des instruments de vol, et aider les astronautes à interpréter les instruments d’un vaisseau spatial lors d’un vol spatial de longue durée.

L’analyse d’images ambiguës peut également aider au diagnostic des personnes souffrant de troubles cognitifs légers et de démence. Une IA entraînée à l’aide de cet algorithme pourrait également être utilisée dans la détection de ces maladies mentales débilitantes.

Anissa Chauvin