Tu croyais pouvoir pondre ton papier de recherche en deux clics sur ChatGPT et le balancer sur ArXiv sans que personne ne bronche ? Mauvaise nouvelle, génie de la startup nation : le vénérable dépôt de preprints a sorti le rouleau compresseur. Thomas Dietterich, section chair de la partie informatique, a dégainé sur X une mise à jour du code de conduite qui fait trembler les claviers des tricheurs numériques.
Le grand ménage de printemps d'ArXiv
Désormais, si ton manuscrit présente des références hallucinées (merci GPT-4 de nous pondre des articles fictifs) ou des meta-commentaires du genre "En tant qu'assistant IA, je dois vous dire que..." — bref, la signature indélébile du slop algorithmique — c'est un an de bannissement direct. Sans appel. Et pour être bien sûr que tu ne reviennes pas en cachette, ArXiv exigera en plus que toute nouvelle soumission soit acceptée par une revue à comité de lecture réputée. Un joli coup de balai qui sent le vécu.
Dietterich ne mâche pas ses mots : "If a paper has incontrovertible evidence that the authors did not check the results of LLM generation". Traduction : si tu fous un prompt et que tu signes sans relire, t'es plus le bienvenu. La plateforme a visiblement atteint son seuil de tolérance zéro face à l'inflation de papiers générés par IA — une inflation qui transforme peu à peu la recherche en marécage de contenu vide.
Mais qui va vraiment être puni ?
Soyons honnêtes : ArXiv tape sur les petits poissons. Ceux qui n'ont même pas assez de jugeote pour virer les marqueurs de l'IA. Les vrais fraudeurs, ceux qui passent leurs papiers au GPT-4 en mode furtif et qui noient les références fictives sous un flot de citations réelles pompageuses, ceux-là continueront de dormir tranquilles. Un an de ban ? C'est un peu comme condamner un tagueur à ne plus utiliser de bombe de peinture : il trouvera bien un mur plus discret.
Et quid des chercheurs qui utilisent l'IA pour améliorer leur prose sans générer de contenu ? La frontière est floue, et ArXiv le sait. La règle repose sur la preuve irréfutable — ce qui signifie que seuls les cas les plus grossiers seront sanctionnés. Une politique de l'autruche déguisée en fermeté.
Une réaction tardive et timide
Bien sûr, il fallait faire quelque chose. ArXiv croule sous les soumissions : plus de 2 millions de preprints et une croissance exponentielle depuis l'arrivée de l'IA générative. Mais exiger une publication en revue réputée pour revenir ? C'est ouvrir la porte à tout un business de prédation éditoriale. Les "revues réputées" sont souvent celles qui facturent des milliers de dollars en frais de publication, et qui peinent à recruter des reviewers. Les chars à bancs du savoir académique vont se frotter les mains.
Au final, ArXiv joue le gendarme, mais avec des menottes en caoutchouc. Si la plateforme voulait vraiment nettoyer les écuries d'Augias, elle devrait imposer une vérification systématique des références par un humain, un taux de rejet plus agressif, et surtout une collaboration avec des outils de détection de contenu généré par IA. Mais non, on préfère agiter l'épouvantail du ban, dans l'espoir que les tricheurs se dénoncent eux-mêmes.
Cher collègue, si tu penses encore que balancer un prompt sur ArXiv te fera gagner des points de citation, sache que le balai est prêt. Mais ne t'inquiète pas : un an, ça passe vite. Et au pire, tu pourras toujours soumettre à une "revue réputée" — pour peu que tu aies les moyens de payer le péage.