Arcee Trinity : une startup de 26 personnes défie l'open source chinois

Arcee AI lance Trinity-Large-Thinking, un modèle 400 milliards de paramètres sous licence Apache 2.0, classé deuxième sur PinchBench à 96% moins cher que Claude.

Open SourceModèles IAStartups

Arcee Trinity : une startup de 26 personnes défie l'open source chinois

Vingt-six salariés, un budget de 20 millions de dollars et un modèle de 400 milliards de paramètres sous licence libre. Arcee AI vient de publier Trinity-Large-Thinking, un modèle de raisonnement open source qui se positionne juste derrière Claude Opus 4.6 sur le benchmark PinchBench, à un coût 96% inférieur. Le rapport de force dans l'open source mondial commence à se reconfigurer.

Arcee Trinity-Large-Thinking, modèle open source de raisonnement avancé

Une architecture conçue pour l'efficacité

Trinity-Large-Thinking repose sur une architecture Mixture-of-Experts sparse : 399 milliards de paramètres au total, dont seulement 13 milliards activés par token grâce à un mécanisme de routage 4-of-256. En pratique, le modèle tourne deux à trois fois plus vite que des modèles denses de taille comparable sur le même matériel.

Arcee a également introduit une nouvelle technique de rééquilibrage de charge appelée SMEBU (Soft-clamped Momentum Expert Bias Updates), qui évite l'effondrement des experts spécialisés et maintient une utilisation plus uniforme des capacités du modèle dans la durée.

Sur PinchBench, le benchmark de référence pour les agents autonomes, Trinity-Large-Thinking obtient 91,9 points, soit à deux points de Claude Opus 4.6 qui détient la première place. Sur AIME25, il atteint 96,3 contre 93,3 pour GLM-5. Sur SWE-bench Verified, qui évalue la capacité à résoudre de vrais bugs logiciels, il affiche 63,2 contre 75,6 pour Opus 4.6. La fenêtre de contexte s'établit à 262 144 tokens via OpenRouter.

Le pari d'un open source américain face aux modèles chinois

Depuis un an, l'open source de frontier est dominé par des acteurs chinois : DeepSeek, Zhipu AI et ses GLM-5, Qwen d'Alibaba. Le PDG d'Arcee, Mark McQuade, assume l'ambition : Trinity-Large-Thinking serait le modèle open source le plus performant jamais publié par une entreprise non-chinoise. L'affirmation est vérifiable sur les benchmarks publics.

La licence Apache 2.0 est au cœur de la stratégie. Elle autorise le téléchargement, le fine-tuning et le déploiement sur des serveurs privés sans restriction commerciale. Pour les entreprises européennes et américaines qui hésitent à envoyer leurs données vers des API hébergées en Chine, Trinity représente une alternative concrète.

Le coût affiché sur l'API d'Arcee est de 0,90 dollar par million de tokens en sortie. Claude Opus 4.6 tourne autour de 22 dollars pour le même volume. L'écart est de 96%. Pour des cas d'usage agentiques à forte volumétrie, la différence devient structurante dans les budgets de développement.

La question qui reste ouverte est celle de la consistance du modèle sur des tâches longues et complexes. Le score sur SWE-bench, à 12 points de Claude, indique que le gap n'est pas comblé sur les tâches de codage les plus exigeantes. Un modèle moins cher n'est pas nécessairement le bon choix pour tous les usages.

Ce que ça signifie pour vous

Les poids de Trinity-Large-Thinking sont disponibles sur Hugging Face et accessibles via l'API d'Arcee ainsi que sur OpenRouter. Pour les développeurs qui construisent des agents autonomes, c'est une option sérieuse à évaluer avant de s'engager sur un modèle propriétaire. Pour les équipes qui souhaitent déployer en local ou fine-tuner sur des données internes, la licence Apache 2.0 ne pose aucune contrainte.

Sources : TechCrunch · VentureBeat · MarkTechPost · Arcee AI