‘Proof by intimidation’: AI is confidently solving ‘impossible’ math problems. But can it convince the world’s top mathematicians?

Lors d’une réunion secrète en 2025, certains des plus grands mathématiciens du monde se sont réunis pour tester le dernier grand modèle de langage d’OpenAI, o4-mini.
Les experts présents à la réunion ont été étonnés de voir à quel point les réponses du modèle ressemblaient à celles d’un vrai mathématicien lorsqu’il livrait une preuve complexe.
Ono a reconnu que le modèle pourrait donner des réponses convaincantes – mais potentiellement incorrectes.
“Malheureusement, l’IA est bien meilleure pour donner l’impression qu’elle a la bonne réponse que pour la trouver réellement… bonne ou mauvaise ; elle aura toujours l’air convaincante.”
Terry Tao, mathématicien de l’UCLA
“Si vous étiez un mauvais mathématicien, vous seriez aussi un mauvais écrivain mathématique et vous mettriez l’accent sur les mauvaises choses.” Terry Taomathématicien à l’UCLA et lauréat 2006 de la prestigieuse médaille Fields, a déclaré à Live Science. “Mais l’IA a brisé ce signal.”
Naturellement, les mathématiciens commencent à craindre que l’IA ne leur envoie des preuves convaincantes qui contiennent en réalité des défauts difficiles à détecter pour les humains.
Tao a averti que les arguments générés par l’IA pourraient être incorrectement acceptés car ils regarder rigoureux.
“Malheureusement, l’IA est bien meilleure pour donner l’impression qu’elle a la bonne réponse que pour la trouver réellement… bonne ou mauvaise ; elle aura toujours l’air convaincante”, a déclaré Tao.
Il a appelé à la prudence quant à l’acceptation des « preuves » de l’IA. “Une chose que nous avons apprise en utilisant les IA, c’est que si vous leur donnez un objectif, ils le feront. tricher comme un fou pour atteindre l’objectif”, a déclaré Tao.
Bien qu’il puisse sembler largement abstrait de se demander si nous pouvons réellement « prouver » des conjectures mathématiques hautement techniques si nous ne parvenons pas à comprendre les preuves, les réponses peuvent avoir des implications significatives. Après tout, si nous ne pouvons pas faire confiance à une preuve, nous ne pouvons pas développer d’autres outils ou techniques mathématiques à partir de cette base.
Par exemple, l’un des problèmes majeurs en mathématiques computationnelles, baptisé P vs NP, demande essentiellement si les problèmes dont les solutions sont faciles à vérifier sont également faciles à trouver en premier lieu. Si nous pouvons le prouver, nous pourrions transformer la planification et le routage, rationaliser les chaînes d’approvisionnement, accélérer la conception des puces et même accélérer la découverte de médicaments. Le revers de la médaille est qu’une preuve vérifiable pourrait également compromettre la sécurité de la plupart des systèmes cryptographiques actuels. Loin d’être obscures, les réponses à ces questions comportent un réel danger.
La preuve est une construction sociale
Cela pourrait choquer les non-mathématiciens d’apprendre que, dans une certaine mesure, les preuves mathématiques d’origine humaine ont toujours été des constructions sociales visant à convaincre d’autres personnes dans le domaine que les arguments étaient justes. Après tout, une preuve mathématique est souvent considérée comme vraie lorsque d’autres mathématiciens l’analysent et la jugent correcte. Cela signifie qu’une preuve largement acceptée ne garantit pas qu’une déclaration soit irréfutablement vraie. André Granvillemathématicien à l’Université de Montréal, soupçonne qu’il existe des problèmes même avec certaines des preuves mathématiques faites par l’homme les plus connues et les plus scrutées.
Il existe des preuves de cette affirmation. “Il y a eu des articles célèbres qui se sont trompés en raison de petits problèmes linguistiques”, a déclaré Granville à Live Science.
L’exemple le plus connu est peut-être Andrew Wiles‘ preuve du dernier théorème de Fermat. Le théorème stipule que bien qu’il existe des nombres entiers où un carré plus un autre carré est égal à un troisième carré (comme 32+42=52), il n’y a pas de nombres entiers qui rendent la même chose vraie pour les cubes, les quatrièmes puissances ou toute autre puissance supérieure.

Wiles a passé sept ans à travailler dans un isolement presque complet et, en 1993, a présenté sa preuve sous forme d’une série de conférences à Cambridge, en grande pompe. Lorsque Wiles termina sa dernière conférence avec la phrase immortelle “Je pense que je vais m’arrêter là”, le public éclata sous un tonnerre d’applaudissements et Le champagne a été débouché pour célébrer l’exploit. Les journaux du monde entier ont proclamé la victoire du mathématicien sur ce problème vieux de 350 ans.

Toutefois, au cours du processus d’évaluation par les pairs, un évaluateur repéré un défaut important dans la preuve de Wiles. Il a passé une autre année à travailler sur le problème et a finalement résolu le problème.
Mais pendant une courte période, le monde a cru que la preuve était résolue, alors qu’en réalité elle ne l’était pas.
Systèmes de vérification mathématique
Pour éviter ce genre de problème, où une preuve est acceptée sans être réellement correcte, on cherche à étayer les preuves avec ce que les mathématiciens appellent des langages de vérification formelle.
Ces programmes informatiques, dont l’exemple le plus connu s’appelle Lean, obligent les mathématiciens à traduire leurs preuves dans un format très précis. L’ordinateur passe ensuite en revue chaque étape, appliquant une logique mathématique rigoureuse pour confirmer que l’argument est correct à 100 %. Si l’ordinateur rencontre une étape dans la preuve qui ne lui plaît pas, il la signale et ne la lâche pas. Cette formalisation codée ne laisse aucune place aux malentendus linguistiques qui, selon Granville, ont tourmenté les preuves précédentes.
Kévin Buzzardmathématicien à l’Imperial College de Londres, est l’un des principaux partisans de la vérification formelle. “J’ai commencé dans ce métier parce que j’avais peur que les preuves humaines soient incomplètes et incorrectes et que nous, les humains, faisions un mauvais travail pour documenter nos arguments”, a déclaré Buzzard à Live Science.
En plus de vérifier les preuves humaines existantes, l’IA, en collaboration avec des programmes comme Lean, pourrait changer la donne, ont déclaré les mathématiciens.
“Si nous forçons la sortie de l’IA à produire des choses dans un langage formellement vérifié, alors cela résout en principe la plupart du problème”, a déclaré Tao.
“Il y a des articles sur les mathématiques où personne ne comprend l’article dans son intégralité. Vous savez, il y a un article avec 20 auteurs et chaque auteur comprend sa part. Personne ne comprend tout. Et c’est très bien. C’est comme ça que ça marche.”
Kevin Buzzard, mathématicien de l’Imperial College de Londres
Buse a accepté. “Vous aimeriez penser que nous pouvons peut-être amener le système non seulement à écrire le résultat du modèle, mais à le traduire en Lean et à l’exécuter via Lean”, a-t-il déclaré. Il a imaginé une interaction entre Lean et l’IA dans laquelle Lean signalerait les erreurs et l’IA tenterait de les corriger.
Si les modèles d’IA peuvent fonctionner avec des langages de vérification formelle, l’IA pourrait alors résoudre certains des problèmes mathématiques les plus difficiles en trouvant des connexions au-delà de la portée de la créativité humaine, ont déclaré des experts à Live Science.
“L’IA est très efficace pour trouver des liens entre des domaines mathématiques que nous ne penserions pas nécessairement relier”, Marc Lackenbymathématicien de l’Université d’Oxford, a déclaré à Live Science.
Une preuve que personne ne comprend ?
En poussant l’idée de preuves d’IA formellement vérifiées à son extrême logique, il existe un avenir réaliste dans lequel l’IA développera des preuves « objectivement correctes » qui sont si compliquées qu’aucun humain ne peut les comprendre.
Cela est troublant pour les mathématiciens d’une tout autre manière. Il pose des questions fondamentales sur l’objectif des mathématiques en tant que discipline. Quel est finalement l’intérêt de prouver quelque chose que personne ne comprend ? Et si nous le faisons, peut-on dire que nous avons enrichi l’état des connaissances humaines ?
Bien entendu, la notion d’une preuve si longue et si compliquée que personne sur Terre ne la comprend n’est pas nouvelle en mathématiques, a déclaré Buzzard.
“Il y a des articles sur les mathématiques où personne ne comprend l’intégralité de l’article. Vous savez, il y a un article avec 20 auteurs et chaque auteur comprend sa partie”, a déclaré Buzzard à Live Science. “Personne ne comprend tout. Et c’est très bien. C’est comme ça que ça marche.”
Buzzard a également souligné que les preuves qui s’appuient sur des ordinateurs pour combler les lacunes n’ont rien de nouveau. “Nous disposons de preuves assistées par ordinateur depuis des décennies”, a déclaré Buzzard. Par exemple, le théorème des quatre couleurs stipule que si vous avez une carte divisée en pays ou en régions, vous n’aurez jamais besoin de plus de quatre couleurs distinctes pour ombrer la carte, de sorte que les régions voisines ne soient jamais de la même couleur.

Il y a près de 50 ans, en 1976, les mathématiciens ont divisé le problème en milliers de petits cas vérifiables et ont écrit des programmes informatiques pour vérifier chacun d’entre eux. Tant que les mathématiciens étaient convaincus qu’il n’y avait aucun problème avec le code qu’ils avaient écrit, ils étaient assurés que la preuve était correcte. La première preuve assistée par ordinateur du théorème des quatre couleurs a été publiée en 1977. La confiance dans la preuve s’est construite progressivement au fil des années et s’est renforcée au point d’être acceptée presque universellement lorsqu’une preuve plus simple, mais toujours assistée par ordinateur, a été produite en 1997 et qu’une preuve formellement vérifiée et vérifiée par machine a été publiée en 2005.
“Le théorème des quatre couleurs a été prouvé avec un ordinateur”, a noté Buzzard. “Les gens étaient très mécontents de cela. Mais maintenant, c’est tout simplement accepté. C’est dans les manuels scolaires.”
Territoire inexploré
Mais ces exemples de preuves assistées par ordinateur et de travail d’équipe mathématique semblent fondamentalement différents de l’IA qui propose, adapte et vérifie une preuve par elle-même – une preuve, peut-être, qu’aucun humain ou équipe d’humains ne pourra jamais espérer comprendre.
Que les mathématiciens l’apprécient ou non, l’IA remodèle déjà la nature même des preuves. Pendant des siècles, l’acte de génération et de vérification de preuves a été une entreprise humaine – des arguments conçus pour convaincre d’autres mathématiciens humains. Nous approchons d’une situation dans laquelle les machines pourraient produire une logique hermétique, vérifiée par des systèmes formels, que même les meilleurs mathématiciens ne parviendront pas à suivre.
Dans ce futur scénario – s’il se réalise – l’IA fera chaque étape, de la proposition aux tests, en passant par la vérification des preuves, « et alors vous aurez gagné », a déclaré Lackenby. “Vous avez prouvé quelque chose.”
Cependant, cette approche soulève une question philosophique profonde : si une preuve devient quelque chose que seul un ordinateur peut comprendre, les mathématiques restent-elles une entreprise humaine ou évoluent-elles vers quelque chose de complètement autre ? Et on se demande à quoi ça sert, a noté Lackenby.



