Le prix de la dépendance
L'annonce est présentée comme une révolution technique. La réalité est plus proche d'une rançon. 80 millions de dollars. C'est le montant de la Série A que viennent de lever Gimlet Labs, une startup dont le produit principal est un logiciel permettant d'exécuter des modèles d'IA sur un méli-mélo de puces — NVIDIA, AMD, Intel, ARM, Cerebras, d-Matrix. Leur argument ? Résoudre le « goulot d'étranglement de l'inférence ». Traduction marketing : vous êtes coincés avec le matériel que vous avez acheté dans la panique, et nous vous vendons la clé pour en sortir.
L'élégance du désespoir
Qualifier cette approche d'« élégante » est un chef-d'œuvre de communication. Ce que Gimlet propose, c'est une couche d'abstraction logicielle, un middleware. C'est l'équivalent tech de mettre un costume sur un tas de ferraille disparate pour lui donner une allure uniforme. L'élégance ne réside pas dans la solution, mais dans le timing commercial parfait. Pendant deux ans, toute l'industrie a couru derrière les GPU NVIDIA, créant une dépendance monstrueuse et une pénurie artificielle. Maintenant que la facture énergétique et la rareté deviennent insoutenables, on cherche désespérément des alternatives. Gimlet vend le pont pour passer de l'autre côté.
Qui paie la facture ?
Suivez l'argent. Les 80 millions ne viennent pas de nulle part. Les VC financent massivement cette « solution » parce qu'elle protège leurs investissements précédents. Les entreprises qui ont misé des centaines de millions sur des fermes de serveurs NVIDIA peuvent, grâce à Gimlet, tenter de diluer leurs coûts en utilisant d'autres puces moins chères ou plus disponibles. C'est un aveu d'échec stratégique coûteux. Au lieu de bâtir une stack technologique cohérente, l'industrie a fait la course au matériel le plus hype, et doit maintenant ajouter une couche logicielle complexe — et payante — pour gérer le bordel.
Le vrai goulot d'étranglement
Le problème n'est pas technique, il est systémique. Le « goulot d'étranglement de l'inférence » n'est que le symptôme d'une frénésie d'innovation mal dirigée. On a optimisé pour la taille des modèles et la course aux benchmarks, pas pour l'efficacité, la soutenabilité ou l'interopérabilité. Des startups comme Gimlet sont les bénéficiaires indirects de cette myopie. Elles ne résolvent pas le problème racine ; elles monnaient la complexité que l'industrie a elle-même créée.
Conclusion : Un marché de la réparation
Ne vous y trompez pas. Le succès de Gimlet Labs est le signe d'un marché malade. C'est l'indicateur qu'une partie significative des dépenses en IA va désormais être consacrée non pas à l'innovation fondamentale, mais à la réparation des mauvais choix passés et à la gestion de l'hétérogénéité chaotique du matériel. Une élégance de circonstance, financée à coups de dizaines de millions, pour colmater les fuites d'un navire qui a été construit trop vite. La prochaine levée de fonds sera probablement pour une startup qui vendra un logiciel pour faire tourner le middleware de Gimlet sur encore plus de types de puces. La boucle est bouclée.