« Les machines peuvent-elles penser? » C’est la question principale mathématicien et informaticien légendaire Alan Turing a posé En octobre 1950. Turing voulait évaluer si les machines pouvaient imiter ou présenter un comportement intelligent au niveau humain, et il a donc fait un test appelé le « jeu d’imitation ». Cela est devenu plus tard connu sous le nom de Turing Test, qui est couramment utilisé pour évaluer la façon dont une machine peut imiter le comportement humain.
La genèse du test de Turing est venue de la difficulté inhérente à établir des critères objectifs qui distingue la pensée originale de son imitation. La contestation est que les preuves de la pensée originale pourraient être niées avec l’argument selon lequel une machine était simplement programmée pour sembler intelligente. Essentiellement, le nœud de prouver si les machines peuvent penser définit ce qu’est la pensée.
Turing voulait défier l’idée Que la nature mécanique des ordinateurs signifie qu’ils ne peuvent pas, en principe, penser. Le mathématicien posait que, si un ordinateur semble indiscernable d’un humain, alors pourquoi ne devrait-il pas être considéré comme une entité pensée?
Comment fonctionne le test Turing?
Turing a proposé un match à trois. Il a d’abord décrit un test dans lequel un homme et une femme entrent dans des chambres séparées et les invités de la fête utilisent des réponses dactylographiées pour essayer de déterminer quelle personne est laquelle, tandis que l’homme et la femme essaient de les convaincre qu’ils sont le sexe opposé.
De là, Turing a proposé un test par lequel un interrogateur distant est chargé de poser des questions à un ordinateur et à un sujet humain, tous deux invisibles, pendant cinq minutes afin de déterminer lequel est sensible. Le succès d’un ordinateur à «penser» pourrait alors être mesuré par la probabilité qu’il soit mal identifié en tant qu’humain.
Une itération ultérieure du jeu d’imitation, proposée par Turing en 1952 dans une émission de la BBC, verrait un ordinateur essayer de convaincre un jury de personnes qu’il était humain.
Le test Turing a été créé comme une expérience de pensée philosophique qu’un moyen pratique de définir l’intelligence des machines. Cependant, il est devenu considéré comme une cible ultime pour l’apprentissage automatique et intelligence artificielle (AI) Systèmes à passer afin de démontrer l’intelligence générale artificielle.
Turing prévu qu’au début des années 2000, un ordinateur programmé serait en mesure de «jouer le jeu d’imitation si bien qu’un interrogateur moyen n’aura pas plus de 70% de chances de faire la bonne identification après cinq minutes de questionnement».
Mais cela n’est pas arrivé. Cependant, la montée en puissance de Chatgpt et d’autres systèmes d’intelligence artificielle et de grands modèles de langage (LLM) a ravivé la conversation autour du test de Turing.
En juin 2024, des chercheurs ont affirmé que le LLM GPT-4 a été jugé humain 54% du temps dans le test Turing dans les cinq minutes suivant la question. Cela bat la prédiction de 30% par Turing, malgré deux décennies de la date prévue du mathématicien. Mais ceci Recherche de l’Université de San Diego impliquait seulement deux joueurs dans le test plutôt que le jeu à trois joueurs d’origine de Turing, donc GPT-4 n’a pas réussi le test de Turing dans les conditions spécifiques qu’il a définies.
Néanmoins, cette recherche montre toujours comment les AIS peuvent au moins imiter les humains avec un certain succès.
Défis et limites du test de Turing
Bien que passer le test Turing pourrait être le grand objectif de prouver la réflexion dans les systèmes d’IA, le test a ses limites et ses adversaires.
Se tuant détaillé et abordé neuf objections à son test et à sa théorie dans les machines à prouver pourrait penser; Ceux-ci vont du concept théologique de la pensée et de l’idée que les machines ne peuvent pas ressentir d’émotions, ou avoir le sens de l’humour, à une limitation mathématique logique qui empêchera simplement une machine de répondre à une question ou de le corriger.
Mais peut-être que l’objection la plus pertinente vient du mathématicien Ada Lovelace, qui quand commentaire Sur l’informatique, le moteur analytique du pionnier Charles Babbage, a suggéré qu’une machine ne peut pas « créer quoi que ce soit » et ne peut faire que ce que nous commandons pour effectuer. La réplique de Turing dans son article devait se demander si les humains peuvent en effet faire quelque chose de vraiment nouveau dans un monde déterministe lié par les lois de la nature et les limites de l’univers. Turing a également noté que les ordinateurs peuvent être contraints mais pouvaient encore faire des choses inattendues – de la même manière que les humains le peuvent malgré notre maquillage génétique et notre biologie.
Au-delà de cela est le fait que le test de Turing n’indique pas, en soi, une conscience ou une intelligence; Il fonctionne plutôt pour critiquer ce qui est compris comme pensé et ce qui pourrait constituer des machines de réflexion. Le test dépend également du jugement de l’interrogateur, d’une comparaison avec les humains et du jugement des comportements uniquement.
Ensuite, il y a l’argument selon lequel le test de Turing est conçu sur la façon dont un sujet agit, ce qui signifie qu’une machine peut simplement simuler la conscience humaine ou la pensée plutôt que d’avoir activement son propre équivalent. Cela peut conduire au Piège de Turing – dans lequel les systèmes d’IA sont excessivement axés sur l’imitation des humains plutôt que pour être conçus pour avoir des fonctions qui permettent aux humains de faire plus ou de stimuler leur cognition au-delà des possibilités de l’esprit humain.
Le test Turing est-il toujours pertinent?
Alors que le test de Turing pourrait être maintenu en tant que référence pour que les systèmes d’IA dépassent, Eleanor Watsonun expert en éthique de l’IA et membre de l’Institut des ingénieurs électriques et électroniques (IEEE), a déclaré à Live Science que « le test de Turing devient de plus en plus obsolète en tant que référence significative pour la capacité de l’intelligence artificielle (IA) ».
Watson a expliqué que les LLM évoluent de simplement imiter les humains à des systèmes agentiques qui sont capables de poursuivre de manière autonome des objectifs via la programmation « échafaudage » – similaire à la façon dont les cerveaux humains construisent de nouvelles fonctions à mesure que l’information circule à travers des couches de neurones.
« Ces systèmes peuvent s’engager dans un raisonnement complexe, générer une création de contenu et aider à la découverte scientifique. Cependant, le véritable défi n’est pas de savoir si l’IA peut tromper les humains dans la conversation, mais si elle peut développer un bon sens, un raisonnement et un alignement d’objectif réels qui correspondent aux valeurs humaines et aux intentions », a déclaré Watson. « Sans cet alignement plus profond, passer le test Turing ne devient qu’une forme sophistiquée de mimétisme plutôt que de véritable intelligence. »
Essentiellement, le test Turing peut évaluer les mauvaises choses pour les systèmes d’IA modernes.
En tant que tels, les scientifiques « doivent développer de nouveaux cadres pour évaluer l’IA qui va au-delà de la simple imitation humaine afin d’évaluer les capacités, les limites, les risques potentiels et, surtout, Alignement avec les valeurs humaines et les objectifs», A déclaré Watson.
Contrairement au test de Turing, ces cadres devront tenir compte des forces des systèmes d’IA et de leurs différences fondamentales par rapport à l’intelligence humaine, dans le but de garantir que l’AIS « améliore, plutôt que de diminuer, l’agence humaine et le bien-être », a ajouté Watson.
« La véritable mesure de l’IA ne sera pas à quel point elle peut agir sur l’homme », conclut Watson, « mais à quel point il peut compléter et augmenter l’humanité, nous soulevant à des hauteurs plus élevées. »