A photograph of puzzle blocks with one piece missing

Les futurs modèles d’IA pourraient être dynamisés par un tout nouveau système logique que les chercheurs appellent « inférentialisme »

Par Anissa Chauvin



Les structures rigides du langage auxquelles nous nous accrochions autrefois avec certitude se fissurent. Prenez le genre, la nationalité ou la religion : ces concepts ne trouvent plus leur place dans les cadres linguistiques rigides du siècle dernier. Simultanément, la montée de IA nous impose le besoin de comprendre comment les mots sont liés au sens et au raisonnement.

Un groupe mondial de philosophes, de mathématiciens et d’informaticiens a trouver une nouvelle compréhension de la logique qui répond à ces préoccupations, surnommé « inférentialisme ».

Une intuition standard de la logique, remontant au moins à Aristote est qu’une conséquence logique devrait être valable en vertu du contenu des propositions impliquées, et non simplement du fait qu’elles sont « vraies » ou « fausses ». Récemment, le logicien suédois Dag Prawitz observé quepeut-être de manière surprenante, le traitement traditionnel de la logique ne parvient absolument pas à saisir cette intuition.

La discipline moderne de la logique, solide colonne vertébrale de la science, de l’ingénierie et de la technologie, est confrontée à un problème fondamental. Au cours des deux derniers millénaires, le fondement philosophique et mathématique de la logique a été l’idée selon laquelle le sens dérive de ce à quoi les mots font référence. Il suppose l’existence de catégories abstraites d’objets flottant dans l’univers, comme le concept de « renard » ou de « femelle » et définit la notion de « vérité » en termes de faits concernant ces catégories.

Par exemple, considérons la déclaration « Tammy est une renarde ». Qu’est-ce que ça veut dire? La réponse traditionnelle est qu’il existe une catégorie de créatures appelées « renardes » et que le nom « Tammy » fait référence à l’une d’entre elles. La proposition est vraie juste dans le cas où « Tammy » est réellement dans la catégorie des « renardes ». Si elle n’est pas une renarde, mais s’identifie comme telle, la déclaration serait fausse selon la logique standard.

La conséquence logique est donc obtenue uniquement par des faits de vérité et non par un processus de raisonnement. Par conséquent, il ne peut pas faire la différence entre, disons, les équations 4=4 et 4=((2 x 52 ) -10)/10 simplement parce qu’ils sont tous les deux vrais, mais la plupart d’entre nous remarqueraient une différence.

Si notre théorie de la logique ne peut pas gérer cela, quel espoir avons-nous d’enseigner à l’IA une pensée plus raffinée et plus subtile ? Quel espoir avons-nous de déterminer ce qui est bien et ce qui ne va pas à l’ère de la post-vérité ?

Langue et sens

Notre nouvelle logique représente mieux le discours moderne. Ses racines remontent à la philosophie radicale du philosophe autrichien excentrique Ludwig Wittgenstein, qui, dans son livre de 1953, Enquêtes philosophiquesa écrit ce qui suit :

« Pour une grande classe de cas d’emploi du mot ‘signification’ – mais pas pour tous – ce mot peut être expliqué de cette manière : le sens d’un mot est son utilisation dans la langue. »

Cette notion donne davantage de sens au contexte et à la fonction. Dans les années 1990, le philosophe américain Robert Brandom « utilisation » raffinée pour signifier « comportement inférentiel »jetant les bases de l’inférentialisme.

Supposons qu’un ami ou un enfant curieux nous demande ce que signifie dire « Tammy est une renarde ». Comment leur répondriez-vous ? Probablement pas en parlant de catégories d’objets. Nous dirions plus probablement que cela signifie « Tammy est une femelle renard ».

Plus précisément, nous expliquerions que du fait que Tammy est une renarde, nous pouvons déduire qu’elle est une femelle et qu’elle est un renard. À l’inverse, si nous connaissions ces deux faits à son sujet, alors nous pourrions effectivement affirmer qu’elle est une renarde. C’est la vision inférentialiste du sens ; plutôt que de supposer des catégories abstraites d’objets flottant dans l’univers, nous reconnaissons que la compréhension est donnée par un riche réseau de relations entre les éléments de notre langage.

Considérez les sujets controversés d’aujourd’hui, comme ceux autour du genre. Nous contournons les questions métaphysiques qui bloquent le discours constructif, comme celle de savoir si les catégories « homme » ou « femme » sont réelles dans un certain sens. De telles questions n’ont pas de sens dans la nouvelle logique, car beaucoup de gens ne croient pas que « femme » soit nécessairement une catégorie avec une seule véritable signification.

En tant qu’inférentialiste, étant donné une proposition telle que « Tammy est une femme », on se demanderait seulement ce que l’on peut déduire de cette déclaration : une personne pourrait tirer des conclusions sur les caractéristiques biologiques de Tammy, une autre sur sa constitution psychologique, tandis qu’une autre encore pourrait considérer une situation complètement différente. une autre facette de son identité.

L’inférentialisme rendu concret

L’inférentialisme est donc un cadre fascinant, mais que signifie le mettre en pratique ? Lors d’une conférence à Stockholm dans les années 1980, le logicien allemand Peter Schroeder-Heister a baptisé un domaine basé sur l’inférentialisme appelé «sémantique de la théorie de la preuve« .

En bref, la sémantique de la théorie de la preuve est un inférentialisme rendu concret. Ce phénomène a connu un développement considérable ces dernières années. Bien que les résultats restent techniques, ils révolutionnent notre compréhension de la logique et constituent une avancée majeure dans notre compréhension du raisonnement et du discours humain et machine.

Les grands modèles de langage (LLM), par exemple, fonctionnent en devinant le mot suivant dans une phrase. Leurs suppositions sont éclairées uniquement par les schémas de discours habituels et par un long programme de formation comprenant des essais et des erreurs avec des récompenses. Par conséquent, ils « halluciner »ce qui signifie qu’ils construisent des phrases formées par des absurdités logiques.

En tirant parti de l’inférence, nous pourrons peut-être leur donner une certaine compréhension des mots qu’ils utilisent. Par exemple, un LLM peut halluciner le fait historique : « Le Traité de Versailles a été signé en 1945 entre l’Allemagne et la France après la seconde guerre mondiale » parce que cela semble raisonnable. Mais armé d’une compréhension inférentielle, il a pu comprendre que le « Traité de Versailles » avait eu lieu après la Première Guerre mondiale et 1918, et non après la Seconde Guerre mondiale et 1945.

Cela pourrait également s’avérer utile en matière de pensée critique et de politique. En ayant une compréhension adaptée des conséquences logiques, nous pourrons peut-être signaler et cataloguer automatiquement les arguments absurdes dans les journaux et les débats. Par exemple, un homme politique peut déclarer : « Le plan de mon adversaire est terrible parce qu’il a l’habitude de prendre de mauvaises décisions. »

Un système doté d’une bonne compréhension des conséquences logiques serait capable de signaler que même s’il est vrai que l’adversaire a un historique de mauvaises décisions, aucune justification réelle n’a été donnée pour ce qui ne va pas dans son plan actuel.

En retirant le « vrai » et le « faux » de leurs piédestaux, nous ouvrons la voie au discernement dans le dialogue. C’est sur la base de ces développements que nous pouvons affirmer qu’un argument – ​​que ce soit dans l’arène houleuse d’un débat politique, lors d’un désaccord animé avec des amis ou dans le monde du discours scientifique – est logiquement valable.

Cet article édité est republié à partir de La conversation sous licence Creative Commons. Lire le article original.

Anissa Chauvin