Deepseek AI Development kosztuje 1,6 miliarda dolarów, obalając mit przystępności cenowej
Deepseek, wybitny chiński startup, stał się potężnym konkurentem na rynku AI, w szczególności wpływając na ceny akcji Nvidia z jego innowacyjnym podejściem. Chatbot firmy przedstawia się z przekonującą obietnicą: „Cześć, zostałem stworzony, abyś mógł zapytać o wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć”. To stwierdzenie odzwierciedla ambicje Deepseka, aby przekraczać granice zdolności AI.
Unikalna architektura i metody treningowe modeli Deepseek wyróżniają je. Jedną z kluczowych technologii jest prognozowanie wielofunkcyjne (MTP) , która pozwala modelowi przewidywać wiele słów jednocześnie, poprawiając zarówno dokładność, jak i wydajność. Kolejną innowacją jest podejście do mieszanki ekspertów (MOE) , wykorzystujące 256 sieci neuronowych w Deepseek V3, z ośmioma aktywowanymi tokenami, zwiększającą prędkość i wydajność przetwarzania. Ponadto, wielowłótniego utajona uwaga (MLA) koncentruje się na kluczowych elementach zdań, zmniejszając szansę na brak ważnych szczegółów i poprawę zdolności modelu do przechwytywania niuansów.
Pomimo roszczenia Deepseek o wydaniu tylko 6 milionów dolarów na szkolenie swojej potężnej sieci neuronowej, Deepseek V3, dalsze dochodzenie ujawnia bardziej znaczącą inwestycję. Firma prowadzi znaczącą infrastrukturę obliczeniową, w tym około 50 000 GPU Nvidia Hopper w wielu centrach danych, kosztującej około 1,6 miliarda dolarów na serwerach i 944 mln USD na wydatki operacyjne. Ta infrastruktura wspiera nie tylko szkolenie AI, ale także badania i modelowanie finansowe.
Jako spółka zależna chińskiego funduszu hedgingowego o wysokiej flyer, Deepseek korzysta z samowfinansowania i posiadania centrów danych, co zwiększa kontrolę nad optymalizacją modelu AI i przyspiesza innowacje. Kompaktowa struktura firmy, w połączeniu z wysokimi wynagrodzeniami przyciągającymi najwyższe talenty wiodących chińskich uniwersytetów, umożliwia zwinne i skuteczne wdrożenie postępów AI.
Podczas gdy Deepseek zainwestował ponad 500 milionów dolarów w rozwój sztucznej inteligencji od samego początku, jego roszczenie o „rewolucyjnym budżecie” wydaje się zawyżone, biorąc pod uwagę szerszy kontekst swoich kosztów inwestycji i infrastruktury. Niemniej jednak podejście Deepseeka pokazuje, że dobrze finansowana, niezależna firma AI może rzeczywiście konkurować z gigantami branżowymi, nawet jeśli ich koszty pozostaną niższe niż w konkurentach, takich jak Chatgpt4o, które wydały 100 milionów dolarów na szkolenie.
Zdjęcie: engame.com
Zdjęcie: engame.com
Zdjęcie: engame.com
Zdjęcie: engame.com
- 1 Arcade Racer Victory Heat Rally w stylu retro spada na Androida Jan 05,2025
- 2 Honkai: Star Rail Wyciek ujawnia charakterystyczny stożek świetlny Tribbie Jan 07,2025
- 3 Pokémon Phenoms: Ujawniono dominację w wodzie! Jan 10,2025
- 4 Szalona gra karciana typu crossover, stworzona przez Capcom i GungHo, Teppen, obchodzi swoje piąte urodziny Jan 06,2025
- 5 Intergalaktyka płonie. Po dwóch tygodniach krytyka zwiastuna Naughty Dog nie ucichła Jan 05,2025
- 6 Lista ofert pracy Persona pojawia się wśród spekulacji na temat Persony 6 Jan 04,2025
- 7 Taktyka Otwarta rejestracja wstępna z mnóstwem nagród! Dec 28,2024
- 8 Spotkaj nostalgiczne potwory w grze Ragnarok Idle Adventure CBT Jan 09,2025
-
Najlepsze trendy w tym sezonie
Łącznie 10