首页 >  新闻 >  DeepSeek的成本显示了:AI Guru暴露了十亿美元的发展

DeepSeek的成本显示了:AI Guru暴露了十亿美元的发展

Authore: Joseph更新日期:Feb 23,2025

DeepSeek令人惊讶的是廉价的AI模型DeepSeek V3震撼了AI市场,导致NVIDIA的股价大幅下降。尽管DeepSeek声称仅仅是600万美元的培训成本,但仔细观察表明,投资更大。

DeepSeek Test图像:ensigame.com

DeepSeek V3的创新架构是其性能的关键。它利用:

  • 多语预测(MTP):同时预测多个单词,提高准确性和效率。
  • 专家的混合物(MOE):使用256个神经网络,为每个处理任务激活8个,加速培训并提高性能。
  • 多头潜在注意力(MLA):反复提取关键细节,最大程度地减少信息丢失并增强细微差别的理解。

DeepSeek V3图像:ensigame.com

但是,半分析发现了DeepSeek使用了约50,000个NVIDIA HOPPER GPU,这是一项巨大的投资,总计约16亿美元的服务器和9.44亿美元的运营成本。这与宣传的600万美元预培训成本形成鲜明对比,后者忽略了研究,改进,数据处理和基础设施。

DeepSeek是中国对冲基金High-Flyer的子公司拥有其数据中心,提供控制和更快的创新。它的自筹资金地位增强了敏捷性。该公司吸引了顶尖人才,一些研究人员每年收入超过130万美元,主要来自中国大学。

DeepSeek图像:ensigame.com

尽管DeepSeek的5亿美元用于AI开发的投资是巨大的,但其精益结构允许有效的创新。这笔600万美元的数字具有误导性,仅占总成本的一小部分。尽管如此,DeepSeek的模型培训成本大大低于竞争对手,例如估计的Chatgpt4o估计$ 1亿美元,强调了其相对于行业巨头的成本效益。

DeepSeek图像:ensigame.com

DeepSeek的成功展示了资金充足的独立人工智能公司有效竞争的潜力。但是,它的成就源于大量投资,技术进步和强大的团队,而不是革命性的预算。