Hogar >  Noticias >  El costo de Deepseek revelado: Ai Guru expone un desarrollo de miles de millones de dólares

El costo de Deepseek revelado: Ai Guru expone un desarrollo de miles de millones de dólares

Authore: JosephActualizar:Feb 23,2025

El modelo de IA sorprendentemente económico de Deepseek, Deepseek V3, ha sacudido el mercado de IA, causando caídas significativas en el precio de las acciones de Nvidia. Si bien Deepseek reclama solo un costo de capacitación de $ 6 millones, un aspecto más cercano revela una inversión mucho más sustancial.

DeepSeek TestImagen: Ensigame.com

La arquitectura innovadora de Deepseek V3 es clave para su rendimiento. Utiliza:

  • Predicción de múltiples token (MTP): predice múltiples palabras simultáneamente, aumentando la precisión y la eficiencia.
  • Mezcla de expertos (MOE): Emplea 256 redes neuronales, activando ocho para cada tarea de procesamiento, acelerando la capacitación y mejorando el rendimiento.
  • Atención latente de múltiples cabezas (MLA): extrae repetidamente detalles clave, minimizando la pérdida de información y mejorando la comprensión de los matices.

DeepSeek V3Imagen: Ensigame.com

Sin embargo, el semianálisis descubrió el uso de Deepseek de aproximadamente 50,000 GPU de la tolva nvidia, una inversión significativa por un total de aproximadamente $ 1.6 mil millones en servidores y $ 944 millones en costos operativos. Esto contrasta fuertemente con el costo de pre-entrenamiento publicitado de $ 6 millones, que omite la investigación, el refinamiento, el procesamiento de datos e infraestructura.

Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, posee sus centros de datos, proporcionando control e innovación más rápida. Su estado autofinanciado mejora la agilidad. La compañía atrae a los mejores talentos, con algunos investigadores ganando más de $ 1.3 millones anuales, principalmente de universidades chinas.

DeepSeekImagen: Ensigame.com

Si bien la inversión de $ 500 millones de Deepseek en desarrollo de IA es sustancial, su estructura magra permite una innovación eficiente. La cifra de $ 6 millones es engañosa, lo que representa solo una fracción del costo total. A pesar de esto, los costos de capacitación modelo de Deepseek son significativamente más bajos que los competidores, como los $ 100 millones estimados para CHATGPT4O, destacando su rentabilidad en relación con los gigantes de la industria.

DeepSeekImagen: Ensigame.com

El éxito de Deepseek muestra el potencial de las compañías de IA independientes bien financiadas para competir de manera efectiva. Sin embargo, sus logros se basan en una inversión sustancial, avances tecnológicos y un equipo fuerte, no un presupuesto revolucionario.