S
Susanoo
NEWS // IA & TECH
LIVE
MODÈLES IAIL Y A 5J3 MIN DE LECTURE

Cohere lance un modèle vocal open-source : la transcription pour les pauvres

Cohere, le challenger qui peine à se faire un nom face aux géants, sort un modèle vocal de 2 milliards de paramètres. Une offre 'open-source' calibrée pour les cartes graphiques grand public, histoire de faire croire à l'accessibilité. On vous explique pourquoi c'est surtout un coup de com' désespéré.

PAR SUSANOO NEWSSOURCE : TECHCRUNCH AI
Coheretranscriptionopen sourcevoice modelmultilingueauto-hébergement

La stratégie du petit poucet face aux ogres

Alors que OpenAI et Google se battent à coups de modèles monstres et de démos tape-à-l'œil, Cohere, l'éternel troisième larron, tente une percée par la petite porte. Leur nouvelle arme ? Command-R 2B, un modèle de transcription vocale. Le pitch : léger, open-source, fait pour tourner sur votre GPU de gamer. La réalité : un aveu d'impuissance face à l'infrastructure colossale requise pour jouer dans la cour des grands.

2 milliards de paramètres : l'économie de la pénurie

Ils présentent les 2 milliards de paramètres comme une vertu. 'Relativement léger'. Traduction : nous n'avons pas les moyens de vous pondre un modèle à 100B, alors on vous vend la frugalité comme une révolution. Le modèle est 'destiné aux GPU de consommation'. Autrement dit, si vous avez une RTX 4090 qui traîne, vous pourrez peut-être le faire tourner sans faire fondre votre compteur électrique. Une cible : les développeurs indie, les bidouilleurs, tous ceux que les API payantes des géants font suer. C'est malin. C'est aussi un marché de niche.

L'open-source, dernier refuge des challengers ?

La licence Apache 2.0. Le mot magique pour faire plaisir à la communauté et gratter quelques points de sympathie. Mais posons la vraie question : qui a besoin de self-hoster un modèle de transcription en 2024 ? Les services cloud sont partout, souvent intégrés, et parfois même raisonnablement priced. Cohere mise sur la paranoïa data (légitime) et le désir de contrôle (compréhensible) pour se tailler un créneau. Stratégie de survie, pas de domination.

14 langues : l'ambition à géométrie variable

Ils annoncent fièrement le support de 14 langues. Pas de quoi faire trembler Whisper d'OpenAI, qui en gère près de 100. La liste ? Probablement les grands marchés occidentaux, avec peut-être un geste vers l'Asie. C'est un modèle pour le B2B des pays riches, pas pour la planète. Encore une fois, le positionnement est clair : on ne vise pas la lune, on vise le bureau d'à côté.

Conclusion : un coup d'épée dans l'eau marketing

Ne vous y trompez pas. Cette annonce n'est pas une innovation fracassante. C'est un mouvement tactique dans un jeu d'échecs où Cohere est en net déficit de pièces. Ils jouent la carte de l'underdog, du pragmatique, du 'démocratique'. C'est intelligent, mais ça sent le coup de poker d'une entreprise qui cherche désespérément un cas d'usage où elle ne se fera pas écraser par la masse et le capital des autres. À suivre : combien de développeurs vont réellement cloner ce repo sur GitHub avant de retourner à l'API pratique d'Anthropic ou de ChatGPT.

← RETOUR À L'ACCUEIL
Cohere lance un modèle vocal open-source : la transcription pour les pauvres — SUSANOO NEWS | SUSANOO NEWS