Numbers and mathematical symbols in the shape of a human head.

«  Math Olympics  » a un nouveau concurrent – IA de Google maintenant «Mieux que les médaillés d’or humains» pour résoudre les problèmes de géométrie

Par Anissa Chauvin

Les chercheurs de Google ont développé un système mathématique de l’intelligence artificielle (IA) qui peut dépasser les médaillés d’or intelligents dans les compétitions internationales de géométrie.

Le système, appelé « Alphageométrie2 » (AG2), est un cadre AI avancé capable de résoudre 84% des problèmes de géométrie posés dans l’Olympiade mathématique internationale (IMO). Les vainqueurs moyens de la médaille d’or de l’OMI ont résolu 81,8% des problèmes d’Olympiad.

Organisé par Google Deepmind, il peut s’engager non seulement dans la correspondance des modèles mais aussi dans la résolution créative de problèmes, ont déclaré les scientifiques. Ils ont décrit leurs résultats dans une étude téléchargée le 7 février sur la préimpression arxiv base de données.

L’annonce de l’entreprise survient un mois après que Microsoft a publié son propre système de raisonnement en mathématiques AI avancé, rstarqui utilise de petits modèles de langage (SML) pour résoudre des équations complexes. Les deux sociétés cherchent à dominer le domaine mathématique de l’IA parce que les scientifiques disent que les systèmes à forte capacité de résolution de problèmes mathématiques pourraient imiter suffisamment d’autres formes de raisonnement humain. Ag2 diffère de RSTAR-Math de Microsoft en ce qu’il se concentre sur la résolution de problèmes avancés avec un modèle de raisonnement hybride, tandis que R-Star utilise des modèles de langage plus petits pour résoudre un éventail plus large de problèmes.

Google a publié le Version originale de l’alphageométrie En janvier 2024, et sa dernière version montre une augmentation des performances de 30% par rapport aux itérations précédentes, ont déclaré les scientifiques dans l’étude. Les améliorations de l’AG2 se concentrent sur la maîtrise de la géométrie qui, contrairement au calcul et à l’algèbre, nécessite un mélange de raisonnement visuel et de logique pour résoudre des problèmes complexes.

Les experts, cependant, prudent contre la visualisation de cette étape comme atteint intelligence générale artificielle (AGI) – Lorsqu’un système d’IA est plus intelligent que les humains dans plusieurs disciplines, au lieu d’être simplement surhumain dans une discipline, quelles que soient les données de formation.

« Alphageométrie2 représente une forme d’intelligence, mais l’intelligence humaine va bien au-delà de cela – nous inventons, plutôt que d’appliquer des connaissances ou de créer l’illusion de la pensée, » John BatesPDG de l’IA Company Ser Group et un médecin en informatique de l’Université de Cambridge, a déclaré à Live Science.

Comment l’IA peut résoudre les problèmes de mathématiques les plus difficiles

La percée de Deepmind est la combinaison réussie de modèles de langue neuronale et moteurs symboliques (systèmes basés sur la logique conçus pour résoudre des problèmes à l’aide de symboles et de paramètres). Le modèle de langue suggère des constructions géométriques tandis que le moteur symbolique les teste. Cette correspondance permet au système de convertir le langage quotidien qu’un humain verrait dans un problème de géométrie et de le convertir en « constructions auxiliaires » que le moteur symbolique peut comprendre et tester.

Le système fonctionne ensuite de concert pour proposer de nouvelles constructions si les précédentes ne fonctionnent pas. Cette recherche de solutions est effectuée en parallèle, passant des informations d’un côté du système à l’autre jusqu’à ce qu’elle arrive à une solution.

AG2 est meilleur que la première version grâce à un modèle de langue neuronale formé sur un ensemble de données plus large et plus diversifié, aux côtés d’un moteur symbolique plus rapide apporté à la vérification des constructions plus géométriques. Le système possède également un algorithme unique pour rechercher et trouver des preuves géométriques.

Les chercheurs DeepMind ont noté que les inconvénients d’Ag2 résident dans son temps de traitement plus long et qu’il ne peut pas gérer les problèmes de géométrie IMO les plus difficiles en géométrie 3D, des équations non linéaires ou des problèmes de points variables (points qui changent la position dans un problème de géométrie dans un problème de géométrie dans un problème de géométrie dans un problème de géométrie ) et / ou des points infinis (problèmes avec une séquence infinie de points et ont une infinité de solutions). Enfin, le système ne peut pas expliquer comment il a atteint ses solutions dans n’importe quelle langue qu’un humain peut comprendre.

La portée des aspirations de Deepmind pour son système AG2 reste carrément dans l’amélioration de raisonnement mathématique. Pourtant, des améliorations dans ce domaine peuvent être appliquées à plusieurs disciplines, notamment la conception de l’ingénierie, la vérification des systèmes automatisés, la robotique, la recherche pharmaceutique et la recherche génomique, ont déclaré les scientifiques.

Le plan est pour AG2 de fournir une automatisation complète de la résolution de problèmes de géométrie, ont ajouté les scientifiques, sans aucune erreur. Dans les versions futures, ils espèrent étendre son soutien à des concepts plus géométriques et pénétrer les problèmes en sous-groupes. Ils prévoient également d’accélérer le processus d’inférence et la fiabilité du système.

Anissa Chauvin