>  訊息 >  DeepSeek的成本顯示了:AI Guru暴露了十億美元的發展

DeepSeek的成本顯示了:AI Guru暴露了十億美元的發展

Authore: Joseph更新:Feb 23,2025

DeepSeek令人驚訝的是廉價的AI模型DeepSeek V3震撼了AI市場,導致NVIDIA的股價大幅下降。盡管DeepSeek聲稱僅僅是600萬美元的培訓成本,但仔細觀察表明,投資更大。

DeepSeek Test圖像:ensigame.com

DeepSeek V3的創新架構是其性能的關鍵。它利用:

  • 多語預測(MTP):同時預測多個單詞,提高準確性和效率。
  • 專家的混合物(MOE):使用256個神經網絡,為每個處理任務激活8個,加速培訓並提高性能。
  • 多頭潛在注意力(MLA):反複提取關鍵細節,最大程度地減少信息丟失並增強細微差別的理解。

DeepSeek V3圖像:ensigame.com

但是,半分析發現了DeepSeek使用了約50,000個NVIDIA HOPPER GPU,這是一項巨大的投資,總計約16億美元的服務器和9.44億美元的運營成本。這與宣傳的600萬美元預培訓成本形成鮮明對比,後者忽略了研究,改進,數據處理和基礎設施。

DeepSeek是中國對衝基金High-Flyer的子公司擁有其數據中心,提供控製和更快的創新。它的自籌資金地位增強了敏捷性。該公司吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要來自中國大學。

DeepSeek圖像:ensigame.com

盡管DeepSeek的5億美元用於AI開發的投資是巨大的,但其精益結構允許有效的創新。這筆600萬美元的數字具有誤導性,僅占總成本的一小部分。盡管如此,DeepSeek的模型培訓成本大大低於競爭對手,例如估計的Chatgpt4o估計$ 1億美元,強調了其相對於行業巨頭的成本效益。

DeepSeek圖像:ensigame.com

DeepSeek的成功展示了資金充足的獨立人工智能公司有效競爭的潛力。但是,它的成就源於大量投資,技術進步和強大的團隊,而不是革命性的預算。