OpenAI, le gourou du buzz, annonce avoir resolu un probleme mathematique datant de 1946. Une conjecture geometrique qui resistait aux meilleurs esprits de la planete. Cette fois, les matheux qui avaient crucifie la derniere gaffe de la firme — souvenez-vous de la disparition embarrassante de GPT-4 en mathematiques — sont eux-memes en train de valider le resultat. Faut-il applaudir ou se mefier ? On penche pour la seconde option.
La conjecture de la sphere qui resistait : un vieux serpent de mer
Cette histoire commence avec un probleme pose en 1946 par le mathematicien Harold Scott MacDonald Coxeter. Il s'agit de savoir si certaines configurations de 40 points sur une sphere peuvent etre reliees entre elles par des lignes de couleurs sans creer de triangle d'une seule teinte. Un casse-tete de la theorie de Ramsey, genre probleme du parti mais en 3D et avec des points alignes. Les experts se sont arrache les cheveux. Jusqu'a ce que OpenAI debarque avec son modele de raisonnement o1-preview.
L'algo a explore 6300 cas possibles pour demontrer qu'il existe bien une configuration a 40 points (appelee QA) qui remplit les conditions. Un resultat que des humains, meme doues, n'avaient pas reussi a prouver. Les trois matheux co-auteurs de l'etude — Adam Kabela, Václav Linek, et David Stanovský — ont verifie la demonstration. Ils annoncent que c'est solide a 100%. Cette fois, pas de fuite en avant.
Pourquoi cette fois serait differente ? Parce que les humains ont relu
L'an passe, OpenAI avait deja clame avoir resolu un probleme math... et s'etait fait descendre en flamme par des reviewers. La difference aujourd'hui ? La publication est cosignee par des mathematiciens. Pas juste un preprint auto-publie sur un blog. Un vrai papier avec revision par des pairs — en cours de soumission a une revue. Et surtout, le code et les algorithmes sont disponibles. Pas de boite noire.
Mais attention, le modele n'a pas invente la preuve. Il a explore systematiquement les cas en utilisant une technique de recherche heuristique. Une brute force intelligente, certes, mais pas un raisonnement creatif. Ce que OpenAI vend comme une prouesse d'intelligence est en fait un calculateur de 6300 cas. Utile, oui. Revolutionnaire ? Non.
Qui se goinfre derriere la tambouille ?
OpenAI ne fait rien par philanthropie. Derriere ce communique enjolive, il y a un enjeu de levée de fonds et de valorisation. Montrer que leur modèle de raisonnement o1-preview peut resoudre des problemes mathematiques reels, c'est attirer les investisseurs qui croient encore a l'AGI. Et accessoirement, faire oublier que GPT-4 echoue a des problemes de logique basique (souvenez-vous de l'episode du test des tasses).
Les matheux impliques ont-ils ete payes ? Le papier mentionne des fonds de recherche academique, pas de cash d'OpenAI. Mais attendez : le modele a ete utilise en interne par OpenAI, et les auteurs humains sont des employs de la firme ? Non, ce sont des collaborateurs externes. L'un d'eux, David Stanovský, est un professeur en Republique Tcheque. Rien de sale a premiere vue. Mais le simple fait qu'OpenAI monopolise la communication autour de ce resultat pue le spin.
Le veritable enseignement : l'IA comme marteau-piqueur, pas comme genie
Ce qui est vraiment nouveau, c'est que pour la premiere fois, un modele de langage a reussi a resoudre un probleme ouvert en mathematiques. Pas avec des raisonnements magiques, mais en genérant des preuves par cas la ou l'humain n'a pas la puissance de calcul. C'est un exploit technique, certes. Mais ca ne prouve pas que les LLM vont bientot comprendre les maths profondes.
En realite, cela montre surtout que les outils d'IA deviennent des assistants puissants pour explorer des espaces combinatoires. Rien de plus. Si OpenAI voulait etre honnete, elle appellerait ca un calculateur de preuves et pas un modele de raisonnement. Mais l'honnetete ne rapporte pas de clics.
Alors, oui, bravo pour la resolution de la conjecture. Mais on attend de voir si le modele peut comprendre pourquoi cette configuration fonctionne, ou s'il se contente de balancer des cas. Et evidemment, on attend aussi les prochaines gaffes.