DeepSeek maintiendra définitivement la remise de 75 % sur son modèle phare V4-Pro, qui devait expirer le 31 mai, a annoncé la société samedi. Les tokens de sortie de l'API V4-Pro coûtent désormais 0,87 $ par million, contre 3,48 $ lors du lancement il y a un mois.
DeepSeek a annoncé samedi que la remise de 75 % sur son modèle phare V4-Pro est désormais permanente, réduisant les coûts de l'API à aussi peu que 0,0035 $ par million de tokens et intensifiant une guerre des prix avec OpenAI, Anthropic et Google.

La startup chinoise d'IA avait initialement prévu que la promotion expire le 31 mai, selon sa page de tarification. Au lieu de cela, la société a déclaré dans un communiqué que la tarification de l'API V4-Pro resterait indéfiniment à un quart des tarifs de lancement, avec des coûts allant de 0,025 à 6 yuans (0,003625 $ à 0,87 $) par million de tokens selon le type d'utilisation.
Avec la nouvelle structure tarifaire, les tokens de sortie V4-Pro coûtent 0,87 $ par million de tokens. Claude Opus 4.7 coûte 25 $ par million de tokens. Le coût de GPT-5.5 est de 30 $.
Selon CloudZero, Gemini 2.5 Pro de Google coûte 12 $. D'autres LLM occidentaux moins coûteux, tels que Claude Sonnet (15 $) et GPT-4.1 (8 $), sont 9 à 17 fois plus chers.
Une application générant 100 millions de tokens de sortie par mois coûterait environ 87 $ sur V4-Pro au nouveau taux, contre 2 500 $ sur Opus 4.7 ou 3 000 $ sur GPT-5.5, selon MindStudio.
Comme Cryptopolitan l'avait rapporté lors du lancement de V4 le mois dernier, DeepSeek avait indiqué que la version Pro coûterait initialement jusqu'à 12 fois plus que la version Flash plus légère en raison de « contraintes en matière de capacité de calcul haut de gamme ».
La société a ajouté que les prix baisseraient une fois que les supernodes Huawei Ascend 950 seraient expédiés en plus grandes quantités au second semestre 2026. La réduction permanente est arrivée des mois avant cet objectif.
DeepSeek n'a pas divulgué si la réduction de prix permanente était due à l'augmentation de l'offre de puces Ascend 950 de Huawei.
Les ventes de puces IA de Huawei ont bénéficié des contrôles à l'exportation américains qui empêchent Nvidia de vendre ses semi-conducteurs les plus avancés en Chine. Des restrictions distinctes sur les équipements de fabrication de puces ont limité la capacité de Huawei à faire évoluer la production Ascend.
Huawei vise 750 000 expéditions de puces IA en 2026, selon les estimations du secteur, bien que sa production totale représente environ 3 % à 5 % de la puissance de calcul combinée de Nvidia.
Quatre entreprises chinoises de puces (Huawei Ascend, Cambricon, Hygon Information et Moore Threads) ont confirmé que leur matériel fonctionnait avec V4-Pro dès le premier jour de lancement.
Début avril, lors de l'introduction de V4, les cours des actions de certaines entreprises chinoises d'intelligence artificielle ont chuté à la Bourse de Hong Kong. Zhipu AI a reculé d'environ 8 % à 9 %, tandis que MiniMax a enregistré une baisse de 7 % à 8 %.
Selon CNBC, Manycore Tech a chuté de 9 %. Les actions des fabricants de puces ont progressé à contre-courant de la tendance.
La stratégie de tarification de DeepSeek a également suscité des frictions avec les concurrents occidentaux. Anthropic a précédemment accusé la société d'« attaques de distillation » qui permettent d'apprendre de manière inappropriée à partir des modèles de Claude, selon Engadget.
La Maison Blanche a accusé la Chine le mois dernier de voler la propriété intellectuelle des laboratoires d'IA américains. L'ambassade de Chine à Washington a rejeté ces allégations.
DeepSeek est simultanément en négociations pour lever des fonds extérieurs pour la première fois, avec Tencent et Alibaba parmi les investisseurs potentiels, à une valorisation supérieure à 20 milliards de dollars, selon Cryptopolitan.
Les agents qui exécutent des tâches à plusieurs étapes de manière autonome peuvent consommer des millions de tokens par session.
Le coût quotidien pour faire fonctionner un agent tel que Claude Opus à un taux de 25 $ par million de tokens de sortie s'élève à des centaines de dollars. DeepSeek V4-Pro à 0,87 $ est inférieur à 40 $.
Les bots de trading crypto, les agents de surveillance DeFi, les processus de révision de code et les applications d'analyse de marché reposent tous sur le maintien des coûts d'inférence en dessous d'un seuil où la valeur de la sortie est supérieure au coût de calcul.
L'annonce de DeepSeek concernant sa tarification permanente permet à une catégorie d'applications d'agents d'être viable sur sa plateforme, ce qui n'est pas le cas sur les plateformes occidentales aux taux actuels.
OpenAI a réduit ses prix tout au long de l'année dernière. Anthropic a lancé Claude Haiku 4.5 à 1 $/5 $ par million de tokens. Google a déployé Gemini Flash à un prix d'entrée de 0,30 $. Cependant, aucun d'eux ne peut rivaliser avec le modèle de tarification de DeepSeek.
Le V4-Pro n'est pas un modèle économique. Il dispose de 1,6 billion de paramètres, d'une fenêtre de contexte de 1 million de tokens, et de benchmarks proches de GPT-5.4 sur les tâches mathématiques et de raisonnement, selon l'analyse de MindStudio.
Ne vous contentez pas de lire les actualités crypto. Comprenez-les. Abonnez-vous à notre newsletter. C'est gratuit.


