Ang nakakagulat na murang modelo ng Deepseek, ang Deepseek V3, ay inalog ang merkado ng AI, na nagdulot ng mga makabuluhang patak sa presyo ng stock ni Nvidia. Habang inaangkin ng Deepseek ang isang $ 6 milyong gastos sa pagsasanay, ang isang mas malapit na hitsura ay nagpapakita ng isang mas malaking pamumuhunan.
Imahe: ensigame.com
Ang makabagong arkitektura ng Deepseek V3 ay susi sa pagganap nito. Gumagamit ito:
- Multi-Token Prediction (MTP): Hinuhulaan ng maraming mga salita nang sabay-sabay, pagpapalakas ng kawastuhan at kahusayan.
- Paghahalo ng mga eksperto (MOE): Gumagamit ng 256 neural network, pag -activate ng walo para sa bawat gawain sa pagproseso, pagpabilis ng pagsasanay at pagpapabuti ng pagganap.
- Multi-head Latent pansin (MLA): Paulit-ulit na kinukuha ang mga pangunahing detalye, pag-minimize ng pagkawala ng impormasyon at pagpapahusay ng pag-unawa sa nuance.
Imahe: ensigame.com
Gayunpaman, ang semianalysis ay walang takip na paggamit ng Deepseek na humigit -kumulang 50,000 NVIDIA HOPPER GPUs - isang makabuluhang pamumuhunan na umabot sa halos $ 1.6 bilyon sa mga server at $ 944 milyon sa mga gastos sa pagpapatakbo. Ito ay kaibahan nang matindi sa naisapubliko na $ 6 milyong gastos sa pre-pagsasanay, na tinatanggal ang pananaliksik, pagpipino, pagproseso ng data, at imprastraktura.
Ang Deepseek, isang subsidiary ng High-Flyer, isang pondo ng hedge ng Tsino, ay nagmamay-ari ng mga sentro ng data nito, na nagbibigay ng kontrol at mas mabilis na pagbabago. Ang katayuan na pinondohan ng sarili ay nagpapabuti ng liksi. Ang kumpanya ay umaakit sa nangungunang talento, na may ilang mga mananaliksik na kumikita ng higit sa $ 1.3 milyon taun -taon, lalo na mula sa mga unibersidad sa Tsino.
Imahe: ensigame.com
Habang ang $ 500 milyon+ na pamumuhunan ng Deepseek sa pag -unlad ng AI ay malaki, ang sandalan na istraktura nito ay nagbibigay -daan para sa mahusay na pagbabago. Ang $ 6 milyong figure ay nakaliligaw, na kumakatawan lamang sa isang bahagi ng kabuuang gastos. Sa kabila nito, ang mga gastos sa pagsasanay sa modelo ng Deepseek ay makabuluhang mas mababa kaysa sa mga kakumpitensya, tulad ng tinatayang $ 100 milyon para sa ChatGPT4O, na itinampok ang pagiging epektibo ng gastos na nauugnay sa mga higante sa industriya.
Imahe: ensigame.com
Ang tagumpay ng Deepseek ay nagpapakita ng potensyal ng mahusay na pinondohan na independiyenteng mga kumpanya ng AI upang epektibong makipagkumpetensya. Gayunpaman, ang mga nagawa nito ay nakaugat sa malaking pamumuhunan, pagsulong sa teknolohiya, at isang malakas na koponan, hindi isang rebolusyonaryong badyet.