Ang development ng Deepseek AI ay nagkakahalaga ng $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit
Ang Deepseek, isang kilalang pagsisimula ng Tsino, ay lumitaw bilang isang kakila -kilabot na katunggali sa merkado ng AI, lalo na na nakakaapekto sa mga presyo ng stock ng NVIDIA kasama ang makabagong diskarte. Ang chatbot ng kumpanya ay nagpapakilala sa sarili ng isang nakakahimok na pangako: "Kumusta, nilikha ako upang maaari kang magtanong ng anuman at makakuha ng isang sagot na maaaring sorpresa ka." Ang pahayag na ito ay sumasalamin sa ambisyon ng Deepseek upang itulak ang mga hangganan ng mga kakayahan ng AI.
Ang natatanging mga pamamaraan ng arkitektura at pagsasanay ng mga modelo ng Deepseek ay naghiwalay sa kanila. Ang isa sa mga pangunahing teknolohiya ay ang multi-token prediction (MTP) , na nagpapahintulot sa modelo na mahulaan ang maraming mga salita nang sabay-sabay, pagpapabuti ng parehong kawastuhan at kahusayan. Ang isa pang pagbabago ay ang halo ng diskarte ng mga eksperto (MOE) , na gumagamit ng 256 neural network sa Deepseek V3, na may walong na -aktibo sa bawat token, pagpapahusay ng bilis ng pagproseso at pagganap. Bilang karagdagan, ang multi-head latent attention (MLA) ay nakatuon sa mga mahahalagang elemento ng pangungusap, binabawasan ang pagkakataon na nawawala ang mga mahahalagang detalye at pagpapabuti ng kakayahan ng modelo upang makuha ang mga nuances.
Sa kabila ng pag -angkin ng Deepseek na gumastos lamang ng $ 6 milyon upang sanayin ang kanilang malakas na neural network, ang Deepseek V3, ang karagdagang pagsisiyasat ay nagpapakita ng isang mas malaking pamumuhunan. Ang kumpanya ay nagpapatakbo ng isang makabuluhang imprastraktura ng computational, kabilang ang halos 50,000 NVIDIA HOPPER GPU sa maraming mga sentro ng data, na nagkakahalaga ng $ 1.6 bilyon sa mga server at $ 944 milyon sa mga gastos sa pagpapatakbo. Ang imprastraktura na ito ay sumusuporta hindi lamang pagsasanay sa AI kundi pati na rin ang pananaliksik at pagmomolde sa pananalapi.
Bilang isang subsidiary ng Chinese Hedge Fund High-flyer, ang mga benepisyo ng Deepseek mula sa pagiging pinondohan ng sarili at pagmamay-ari ng mga sentro ng data nito, na nagpapaganda ng kontrol nito sa pag-optimize ng modelo ng AI at pinapabilis ang pagbabago. Ang compact na istraktura ng kumpanya, na sinamahan ng mataas na suweldo na nakakaakit ng nangungunang talento mula sa nangungunang unibersidad ng Tsino, ay nagbibigay -daan sa maliksi at epektibong pagpapatupad ng mga pagsulong ng AI.
Habang ang Deepseek ay namuhunan ng higit sa $ 500 milyon sa pag -unlad ng AI mula nang magsimula ito, ang pag -angkin nito ng isang "rebolusyonaryong badyet" ay tila overstated kapag isinasaalang -alang ang mas malawak na konteksto ng mga pamumuhunan at gastos sa imprastraktura. Gayunpaman, ang diskarte ng Deepseek ay nagpapakita na ang isang mahusay na pinondohan, independiyenteng kumpanya ng AI ay maaaring makipagkumpetensya sa mga higante sa industriya, kahit na ang kanilang mga gastos ay mananatiling mas mababa kaysa sa mga kakumpitensya tulad ng Chatgpt4o, na gumugol ng $ 100 milyon sa pagsasanay.
Larawan: ensigame.com
Larawan: ensigame.com
Larawan: ensigame.com
Larawan: ensigame.com
- 1 Bumaba Sa Android ang Retro-Style Arcade Racer Victory Heat Rally Jan 05,2025
- 2 Honkai: Star Rail Inihayag ng Leak ang Signature Light Cone ni Tribbie Jan 07,2025
- 3 Pokémon Phenoms: Aquatic Supremacy Inihayag! Jan 10,2025
- 4 Ang nakakabaliw na crossover card game ng Capcom at GungHo na Teppen ay nagdiriwang ng ikalimang anibersaryo nito Jan 06,2025
- 5 Nag-aapoy ang Intergalactic. Makalipas ang dalawang linggo, hindi pa rin humupa ang pagbatikos sa trailer ng Naughty Dog Jan 05,2025
- 6 Bumubuo ang Listahan ng Trabaho ng Persona Sa gitna ng Mga Ispekulasyon ng Persona 6 Jan 04,2025
- 7 Tactics Open Pre-Registration with Rewards Galore! Dec 28,2024
- 8 Makatagpo ng Nostalgic Monsters sa Ragnarok Idle Adventure CBT Jan 09,2025
-
Nangungunang mga uso sa kagandahan para sa panahong ito
Kabuuan ng 10
-
Nakakahumaling na arcade game para sa mobile
Kabuuan ng 10