Deepseek IA Development custa US $ 1,6 bilhão, desmistrvando mito de acessibilidade
A Deepseek, uma proeminente startup chinesa, emergiu como um concorrente formidável no mercado de IA, impactando principalmente os preços das ações da Nvidia com sua abordagem inovadora. O chatbot da empresa se apresenta com uma promessa convincente: "Oi, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que possa até surpreendê -lo". Esta afirmação reflete a ambição de Deepseek de ultrapassar os limites das capacidades de IA.
Os métodos exclusivos de arquitetura e treinamento dos modelos de Deepseek os diferenciam. Uma das principais tecnologias é a previsão de vários toques (MTP) , que permite ao modelo prever várias palavras simultaneamente, melhorando a precisão e a eficiência. Outra inovação é a abordagem da mistura de especialistas (MOE) , utilizando 256 redes neurais no Deepseek V3, com oito ativados por token, aumentando a velocidade e o desempenho do processamento. Além disso, a atenção latente de várias cabeças (MLA) se concentra nos elementos cruciais da frase, reduzindo a chance de perder detalhes importantes e melhorar a capacidade do modelo de capturar nuances.
Apesar da alegação de Deepseek de gastar apenas US $ 6 milhões para treinar sua poderosa rede neural, Deepseek V3, uma investigação mais aprofundada revela um investimento mais substancial. A empresa opera uma infraestrutura computacional significativa, incluindo cerca de 50.000 GPUs NVIDIA Hopper em vários data centers, custando cerca de US $ 1,6 bilhão em servidores e US $ 944 milhões em despesas operacionais. Essa infraestrutura suporta não apenas o treinamento de IA, mas também a pesquisa e a modelagem financeira.
Como subsidiária do fundo de hedge chinês, o DeepSeek se beneficia de ser autofinanciado e possuir seus data centers, o que aprimora seu controle sobre a otimização do modelo de IA e acelera a inovação. A estrutura compacta da empresa, combinada com altos salários que atrai os principais talentos das principais universidades chinesas, permite a implementação ágil e eficaz dos avanços da IA.
Embora a Deepseek tenha investido mais de US $ 500 milhões em desenvolvimento de IA desde a sua criação, sua reivindicação de um "orçamento revolucionário" parece exagerado ao considerar o contexto mais amplo de seus investimentos e custos de infraestrutura. No entanto, a abordagem da Deepseek demonstra que uma empresa de IA independente e bem financiada pode realmente competir com gigantes do setor, mesmo que seus custos permaneçam inferiores aos de concorrentes como o ChatGPT4O, que gastou US $ 100 milhões em treinamento.
Imagem: Ensigame.com
Imagem: Ensigame.com
Imagem: Ensigame.com
Imagem: Ensigame.com
- 1 Retro-estilo Arcade Racer Victory Heat Rally cai no Android Jan 05,2025
- 2 Honkai: Star Rail Vazamento revela cone de luz exclusivo de Tribbie Jan 07,2025
- 3 Pokémon Phenoms: Supremacia Aquática Revelada! Jan 10,2025
- 4 O insano jogo de cartas crossover da Capcom e GungHo, Teppen, está comemorando seu quinto aniversário Jan 06,2025
- 5 A Intergaláctica está em chamas. Depois de duas semanas, as críticas ao trailer da Naughty Dog não diminuíram Jan 05,2025
- 6 Lista de empregos da Persona surge em meio a especulações da Persona 6 Jan 04,2025
- 7 Táticas abrem pré-registro com recompensas em abundância! Dec 28,2024
- 8 Encontre monstros nostálgicos em Ragnarok Idle Adventure CBT Jan 09,2025
-
TELHE TENDÊNCIAS DE ABELE
Um total de 10
-
Jogos de arcade viciantes para celular
Um total de 10