Maison >  Nouvelles >  Le coût de Deepseek révélé: AI Guru expose le développement d'un milliard de dollars

Le coût de Deepseek révélé: AI Guru expose le développement d'un milliard de dollars

Authore: JosephMise à jour:Feb 23,2025

Le modèle d'IA étonnamment bon marché de Deepseek, Deepseek V3, a ébranlé le marché de l'IA, provoquant des baisses importantes du cours de l'action de NVIDIA. Alors que Deepseek revendique un coût de formation de 6 millions de dollars, un examen plus approfondi révèle un investissement beaucoup plus substantiel.

DeepSeek Test Image: esigame.com

L'architecture innovante de Deepseek V3 est la clé de ses performances. Il utilise:

  • Prédiction multi-token (MTP): prédit plusieurs mots simultanément, augmentant la précision et l'efficacité.
  • Mélange d'experts (MOE): utilise 256 réseaux de neurones, activant huit pour chaque tâche de traitement, accélérant la formation et améliorant les performances.
  • Attention latente multi-tête (MLA): Extrait à plusieurs reprises les détails clés, minimisant la perte d'informations et améliorant la compréhension des nuances.

DeepSeek V3 Image: esigame.com

Cependant, la semianalyse a révélé l'utilisation par Deepseek d'environ 50 000 GPU Nvidia Hopper - un investissement important totalisant environ 1,6 milliard de dollars de serveurs et 944 millions de dollars en coûts opérationnels. Cela contraste fortement avec le coût de pré-formation de 6 millions de dollars médiatisé, ce qui omet la recherche, le raffinement, le traitement des données et les infrastructures.

Deepseek, une filiale de High Flyer, un fonds spéculatif chinois, possède ses centres de données, fournissant un contrôle et une innovation plus rapide. Son statut autofinancé améliore l'agilité. La société attire les meilleurs talents, certains chercheurs gagnant plus de 1,3 million de dollars par an, principalement des universités chinoises.

DeepSeek Image: esigame.com

Alors que l'investissement de 500 millions de dollars + de Deepseek dans le développement de l'IA est substantiel, sa structure allégée permet une innovation efficace. Le chiffre de 6 millions de dollars est trompeur, ne représentant qu'une fraction du coût total. Malgré cela, les coûts de formation des modèles de Deepseek sont nettement inférieurs à ceux des concurrents, tels que les 100 millions de dollars estimés pour ChatGpt4O, soulignant sa rentabilité par rapport aux géants de l'industrie.

DeepSeek Image: esigame.com

Le succès de Deepseek présente le potentiel de sociétés d'IA indépendantes bien financées à rivaliser efficacement. Cependant, ses réalisations sont enracinées dans des investissements substantiels, des progrès technologiques et une équipe solide, et non dans un budget révolutionnaire.