NVIDIA Nemotron 3 Super : des modèles ouverts conçus pour l'IA agentique

NVIDIA déploie Nemotron 3 Super, un modèle MoE hybride open source qui offre 5x plus de débit pour les agents IA, adopté déjà par Palantir, CrowdStrike et Cursor.

Modèles IAOpen SourceDéveloppeurs

NVIDIA Nemotron 3 Super : des modèles ouverts conçus pour l'IA agentique

NVIDIA n'est plus seulement un fabricant de puces. Avec Nemotron 3, la société publie une famille complète de modèles ouverts spécifiquement calibrés pour les systèmes d'agents autonomes, accompagnée de jeux de données et d'environnements d'entraînement par renforcement. Le modèle Super, désormais disponible, annonce 5x plus de débit que son prédécesseur. C'est une entrée directe sur le terrain où Meta, Arcee et Mistral se disputent déjà l'attention des développeurs.

NVIDIA Nemotron 3 Super, modèle open source pour agents IA autonomes

Une famille de trois modèles aux profils distincts

Nemotron 3 se décline en trois tailles pensées pour des usages différents. Nemotron 3 Nano totalise 30 milliards de paramètres et n'en active que 3 milliards par token : il cible les tâches légères comme le débogage de code, la synthèse de documents ou les assistants conversationnels à faible coût d'inférence.

Nemotron 3 Super monte à environ 120 milliards de paramètres pour 12 milliards actifs par token. C'est lui qui constitue la pièce centrale de l'annonce : conçu pour les applications multi-agents, il repose sur une architecture hybride qui combine des couches Mamba et Transformer dans une structure Mixture-of-Experts. NVIDIA mesure un gain de 5x sur le débit par rapport à la génération précédente, et de 2x sur la précision dans les tâches de raisonnement complexe.

Nemotron 3 Ultra, avec 500 milliards de paramètres dont 50 milliards actifs, complète la gamme pour les cas d'usage les plus exigeants. Il reste disponible sur invitation dans un premier temps, avec une mise à disposition générale prévue pour le premier semestre 2026.

Les poids sont accessibles sur Hugging Face, via build.nvidia.com, Perplexity et OpenRouter.

NVIDIA comme fournisseur de modèles : un changement de posture

Ce qui distingue Nemotron 3 des simples publications de poids, c'est l'écosystème qui l'accompagne. NVIDIA fournit un corpus de préentraînement de 3 000 milliards de tokens documenté publiquement, ainsi que des environnements d'entraînement par renforcement que les équipes peuvent réutiliser pour spécialiser les modèles sur leurs propres tâches agentiques.

La liste des adopteurs précoces est révélatrice : Accenture, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, ServiceNow, Siemens, Synopsys et Zoom ont intégré des modèles de la famille Nemotron dans leurs systèmes. CrowdStrike l'utilise en cybersécurité, Cursor en assistance au code, Palantir dans ses pipelines d'analyse de données. Ce ne sont pas des expérimentations.

La stratégie de NVIDIA est lisible : les entreprises qui achètent des GPU H200 ou Blackwell pour entraîner et servir des agents ont aussi besoin de modèles de base optimisés pour ce matériel. Nemotron 3 se positionne comme la couche logicielle qui maximise le retour sur investissement de l'infrastructure NVIDIA. Le risque pour l'entreprise est de créer une dépendance verticale que les développeurs pourraient trouver contraignante, même sous licence ouverte.

Ce que ça signifie pour vous

Nemotron 3 Super est disponible dès maintenant sur OpenRouter et Hugging Face. Pour les équipes qui construisent des agents avec des outils comme LangChain, LlamaIndex ou des systèmes MCP, le modèle constitue une base solide à tester sur des tâches de raisonnement multi-étapes. La documentation technique de NVIDIA, plus complète que la moyenne des publications open source, facilite l'audit du modèle avant un déploiement en production.

Sources : NVIDIA Newsroom · NVIDIA Blog · NVIDIA Technical Blog · The New Stack