DeepSeek V4 : un trillion de paramètres, open source et sans puce NVIDIA

DeepSeek lance V4, entraîné exclusivement sur des puces Huawei Ascend 950PR. Premier modèle frontier à se passer entièrement de NVIDIA, disponible en open source sous Apache 2.0.

Modèles IAOpen Source

DeepSeek V4 : un trillion de paramètres, open source et sans puce NVIDIA

DeepSeek publie son quatrième modèle en open source sous licence Apache 2.0. V4 n'est pas une mise à jour incrémentale. C'est la première fois qu'un modèle de niveau frontier, capable de rivaliser avec GPT-5 ou Claude sur les grands benchmarks, tourne sur une infrastructure entièrement chinoise, du silicium au logiciel.

Serveurs sous éclairage terracotta dramatique, fond quasi-noir, ambiance datacenter cinématographique

Un modèle d'un trillion de paramètres pour moins de six millions de dollars

DeepSeek V4 repose sur une architecture Mixture-of-Experts (MoE). Il totalise environ un trillion de paramètres, mais n'en active que 37 milliards par token lors de l'inférence. Ce mécanisme de sélection réduit drastiquement le coût de calcul à chaque requête, sans sacrifier la précision.

Le modèle dispose d'une fenêtre de contexte d'un million de tokens, gère nativement le texte, l'image et la vidéo, et atteint 81 % sur le benchmark SWE-bench, qui évalue la capacité à résoudre des problèmes réels de code. Son coût d'entraînement est estimé à 5,2 millions de dollars, soit une fraction du budget consacré aux modèles comparables des laboratoires américains.

Les poids sont publiés sous licence Apache 2.0, ce qui permet un usage commercial sans restriction. N'importe qui peut télécharger, modifier et déployer V4.

La fin de la dépendance aux puces et logiciels américains

Le vrai choc, dans la publication de V4, n'est pas son architecture. C'est ce qu'il n'utilise pas. DeepSeek a entraîné ce modèle exclusivement sur des puces Huawei Ascend 950PR, sans la moindre dépendance à CUDA, le cadre logiciel de NVIDIA qui équipe aujourd'hui l'ensemble de l'industrie IA mondiale.

Pour remplacer CUDA, DeepSeek, Huawei et Cambricon ont travaillé ensemble sur CANN, le cadre de calcul propriétaire de Huawei, et l'ont adapté aux exigences d'un entraînement à cette échelle. Le résultat est une pile technologique complète qui n'emprunte rien à l'écosystème américain, du composant au modèle final.

Le PDG de NVIDIA Jensen Huang a publiquement reconnu que V4 représente une menace sérieuse pour la position dominante de son entreprise. Du côté chinois, Alibaba, ByteDance et Tencent auraient déjà passé des commandes massives de puces Ascend en anticipation des prochains modèles.

Ce que ça signifie pour vous

Pour un développeur ou un créateur, V4 arrive au meilleur moment. La licence Apache 2.0 autorise l'intégration commerciale sans frais de licence. La fenêtre d'un million de tokens ouvre la voie à des applications documentaires et vidéo qui dépassaient les capacités des générations précédentes.

Pour l'industrie, le signal est plus lourd. Jusqu'ici, tous les grands modèles, qu'ils viennent d'OpenAI, d'Anthropic ou de Google, reposaient sur des GPU NVIDIA. V4 brise cette règle. Si d'autres laboratoires chinois reproduisent cette démarche, la capacité des États-Unis à exercer une pression via les restrictions à l'exportation de puces perdra une grande partie de son efficacité.

Le débat sur l'utilité réelle des contrôles à l'exportation, déjà vif depuis DeepSeek R1 en 2025, vient de passer à un stade nouveau.

Sources : Reuters via The Information · NxCode · Dataconomy · Tom's Hardware · Tech Startups