Ah, Stability AI. La start-up qui promettait de sauver le monde avec des images générées par IA et qui, depuis, enchaîne les déboires comme un mauvais feuilleton. Voilà que leur dernier tour de passe-passe s’appelle Stability Audio 3.0. Un modèle audio « révolutionnaire » — bien sûr — qui, selon le communiqué de presse, peut créer des chansons de 6 minutes. Sauf que, surprise : la version « small » qui tourne sur votre appareil génère au mieux 2 minutes. Deux. Minutes. Pas six. 66% de promesse en moins, mais qui compte ?
La soupe au mensonge
Regardons les faits. Stability AI annonce un modèle capable de produire des morceaux de 6 minutes. Génial, non ? Sauf que le modèle « small » — le seul à peu près déployable sur un appareil grand public — se limite à 2 minutes. Et le modèle complet ? Mystère. Pas de date de sortie, pas de détail sur les contraintes techniques. Juste un vague « bientôt ». En attendant, les développeurs et musiciens qui espéraient un outil décent se retrouvent avec un synthétiseur à 2 balles qui bégaye au bout de 120 secondes. C’est comme promettre un banquet et servir une biscotte.
Qui se goinfre, qui se fait rouler
Stability AI a levé des millions. Elle pompe des subsides, des subventions, de l’argent frais. Pendant ce temps, les utilisateurs beta-testent des produits à moitié cuits. Le vrai public cible ? Pas les musiciens. Les investisseurs. Ceux qui veulent entendre « 6 minutes » dans un pitch deck, pas dans la réalité. Pendant que Stability se pavanne, des projets open source comme AudioCraft ou Bark produisent déjà des boucles de qualité correcte sans promettre la lune. Mais eux n’ont pas le marketing tape-à-l’œil.
Le hardware : le maillon faible qu’on cache
Le modèle « small » tourne sur un GPU de smartphone — bravo. Sauf que faire tourner un modèle de génération audio en local, c’est un enfer de latence et de batterie. Les 2 minutes annoncées sont probablement obtenues après un temps de calcul qui ferait pâlir une séance de rendu 3D. Et la qualité ? Des samples qui sonnent comme un synthé pourri des années 80, avec des artefacts à chaque transition. Mais chut, c’est révolutionnaire.
La morale de l’histoire
Stability AI continue sa politique du « fake it ’til you make it ». Le communiqué enfle, le produit rétrécit. Les musiciens qui espéraient un outil de composition sérieux feraient mieux d’aller apprendre un vrai instrument. Quant aux investisseurs, ils finiront comme les précédents : avec des valises de promesses et des modèles qui tiennent dans une poche — mais pas les poches des actionnaires.