Bahay News > Ang development ng Deepseek AI ay nagkakahalaga ng $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit

Ang development ng Deepseek AI ay nagkakahalaga ng $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit

by Claire Apr 18,2025

Ang Deepseek, isang kilalang pagsisimula ng Tsino, ay lumitaw bilang isang kakila -kilabot na katunggali sa merkado ng AI, lalo na na nakakaapekto sa mga presyo ng stock ng NVIDIA kasama ang makabagong diskarte. Ang chatbot ng kumpanya ay nagpapakilala sa sarili ng isang nakakahimok na pangako: "Kumusta, nilikha ako upang maaari kang magtanong ng anuman at makakuha ng isang sagot na maaaring sorpresa ka." Ang pahayag na ito ay sumasalamin sa ambisyon ng Deepseek upang itulak ang mga hangganan ng mga kakayahan ng AI.

Ang natatanging mga pamamaraan ng arkitektura at pagsasanay ng mga modelo ng Deepseek ay naghiwalay sa kanila. Ang isa sa mga pangunahing teknolohiya ay ang multi-token prediction (MTP) , na nagpapahintulot sa modelo na mahulaan ang maraming mga salita nang sabay-sabay, pagpapabuti ng parehong kawastuhan at kahusayan. Ang isa pang pagbabago ay ang halo ng diskarte ng mga eksperto (MOE) , na gumagamit ng 256 neural network sa Deepseek V3, na may walong na -aktibo sa bawat token, pagpapahusay ng bilis ng pagproseso at pagganap. Bilang karagdagan, ang multi-head latent attention (MLA) ay nakatuon sa mga mahahalagang elemento ng pangungusap, binabawasan ang pagkakataon na nawawala ang mga mahahalagang detalye at pagpapabuti ng kakayahan ng modelo upang makuha ang mga nuances.

Sa kabila ng pag -angkin ng Deepseek na gumastos lamang ng $ 6 milyon upang sanayin ang kanilang malakas na neural network, ang Deepseek V3, ang karagdagang pagsisiyasat ay nagpapakita ng isang mas malaking pamumuhunan. Ang kumpanya ay nagpapatakbo ng isang makabuluhang imprastraktura ng computational, kabilang ang halos 50,000 NVIDIA HOPPER GPU sa maraming mga sentro ng data, na nagkakahalaga ng $ 1.6 bilyon sa mga server at $ 944 milyon sa mga gastos sa pagpapatakbo. Ang imprastraktura na ito ay sumusuporta hindi lamang pagsasanay sa AI kundi pati na rin ang pananaliksik at pagmomolde sa pananalapi.

Bilang isang subsidiary ng Chinese Hedge Fund High-flyer, ang mga benepisyo ng Deepseek mula sa pagiging pinondohan ng sarili at pagmamay-ari ng mga sentro ng data nito, na nagpapaganda ng kontrol nito sa pag-optimize ng modelo ng AI at pinapabilis ang pagbabago. Ang compact na istraktura ng kumpanya, na sinamahan ng mataas na suweldo na nakakaakit ng nangungunang talento mula sa nangungunang unibersidad ng Tsino, ay nagbibigay -daan sa maliksi at epektibong pagpapatupad ng mga pagsulong ng AI.

Habang ang Deepseek ay namuhunan ng higit sa $ 500 milyon sa pag -unlad ng AI mula nang magsimula ito, ang pag -angkin nito ng isang "rebolusyonaryong badyet" ay tila overstated kapag isinasaalang -alang ang mas malawak na konteksto ng mga pamumuhunan at gastos sa imprastraktura. Gayunpaman, ang diskarte ng Deepseek ay nagpapakita na ang isang mahusay na pinondohan, independiyenteng kumpanya ng AI ay maaaring makipagkumpetensya sa mga higante sa industriya, kahit na ang kanilang mga gastos ay mananatiling mas mababa kaysa sa mga kakumpitensya tulad ng Chatgpt4o, na gumugol ng $ 100 milyon sa pagsasanay.

Pagsubok sa Deepseek Larawan: ensigame.com