Deepseek IA Development custa US $ 1,6 bilhão, desmistrvando mito de acessibilidade
A Deepseek, uma proeminente startup chinesa, emergiu como um concorrente formidável no mercado de IA, impactando principalmente os preços das ações da Nvidia com sua abordagem inovadora. O chatbot da empresa se apresenta com uma promessa convincente: "Oi, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que possa até surpreendê -lo". Esta afirmação reflete a ambição de Deepseek de ultrapassar os limites das capacidades de IA.
Os métodos exclusivos de arquitetura e treinamento dos modelos de Deepseek os diferenciam. Uma das principais tecnologias é a previsão de vários toques (MTP) , que permite ao modelo prever várias palavras simultaneamente, melhorando a precisão e a eficiência. Outra inovação é a abordagem da mistura de especialistas (MOE) , utilizando 256 redes neurais no Deepseek V3, com oito ativados por token, aumentando a velocidade e o desempenho do processamento. Além disso, a atenção latente de várias cabeças (MLA) se concentra nos elementos cruciais da frase, reduzindo a chance de perder detalhes importantes e melhorar a capacidade do modelo de capturar nuances.
Apesar da alegação de Deepseek de gastar apenas US $ 6 milhões para treinar sua poderosa rede neural, Deepseek V3, uma investigação mais aprofundada revela um investimento mais substancial. A empresa opera uma infraestrutura computacional significativa, incluindo cerca de 50.000 GPUs NVIDIA Hopper em vários data centers, custando cerca de US $ 1,6 bilhão em servidores e US $ 944 milhões em despesas operacionais. Essa infraestrutura suporta não apenas o treinamento de IA, mas também a pesquisa e a modelagem financeira.
Como subsidiária do fundo de hedge chinês, o DeepSeek se beneficia de ser autofinanciado e possuir seus data centers, o que aprimora seu controle sobre a otimização do modelo de IA e acelera a inovação. A estrutura compacta da empresa, combinada com altos salários que atrai os principais talentos das principais universidades chinesas, permite a implementação ágil e eficaz dos avanços da IA.
Embora a Deepseek tenha investido mais de US $ 500 milhões em desenvolvimento de IA desde a sua criação, sua reivindicação de um "orçamento revolucionário" parece exagerado ao considerar o contexto mais amplo de seus investimentos e custos de infraestrutura. No entanto, a abordagem da Deepseek demonstra que uma empresa de IA independente e bem financiada pode realmente competir com gigantes do setor, mesmo que seus custos permaneçam inferiores aos de concorrentes como o ChatGPT4O, que gastou US $ 100 milhões em treinamento.
Imagem: Ensigame.com
Imagem: Ensigame.com
Imagem: Ensigame.com
Imagem: Ensigame.com
- 1 Fortnite: Capítulo 6 Temporada 1 Locais NPC Feb 13,2025
- 2 A jornada culinária prospera para seis Jan 01,2025
- 3 Pokémon Go está comemorando o ano novo de 2025 com fogos de artifício festivos e muito mais! Jan 03,2025
- 4 Roblox: Gatos Guerreiros: Ultimate Edition Códigos (janeiro de 2025) Feb 12,2025
- 5 Dicas para conquistar o Dragon Quest III: remake HD-2D Feb 21,2025
- 6 Códigos de jogo Roblox Atualizado: abril de 2025 May 13,2025
- 7 Como corrigir os códigos de erro comuns da Marvel Rivals Feb 20,2025
- 8 Pokémon GO Fest 2025: Datas de festas, locais, detalhes revelados Feb 13,2025
-
TELHE TENDÊNCIAS DE ABELE
Um total de 10
-
Aplicativos de papel de parede exclusivos para cada estilo
Um total de 10
-
Ultimate Baseball Games for Android
Um total de 10