Deepseek AI Development cuesta $ 1.6 mil millones, desacreditando el mito de la asequibilidad
Deepseek, una startup china destacada, se ha convertido en un competidor formidable en el mercado de IA, especialmente afectando los precios de las acciones de Nvidia con su enfoque innovador. El chatbot de la compañía se presenta con una promesa convincente: "Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que incluso te sorprenda". Esta declaración refleja la ambición de Deepseek de superar los límites de las capacidades de IA.
Los métodos únicos de arquitectura y entrenamiento de los modelos de Deepseek los distinguen. Una de las tecnologías clave es la predicción múltiple (MTP) , lo que permite que el modelo predice múltiples palabras simultáneamente, mejorando tanto la precisión como la eficiencia. Otra innovación es el enfoque de la mezcla de expertos (MOE) , utilizando 256 redes neuronales en Deepseek V3, con ocho activados por token, mejorando la velocidad y el rendimiento de procesamiento. Además, la atención latente de múltiples cabezas (MLA) se centra en elementos de oraciones cruciales, reduciendo la posibilidad de perder detalles importantes y mejorar la capacidad del modelo para capturar matices.
A pesar de la afirmación de Deepseek de gastar solo $ 6 millones para capacitar a su poderosa red neuronal, Deepseek V3, una mayor investigación revela una inversión más sustancial. La compañía opera una infraestructura computacional significativa, que incluye aproximadamente 50,000 GPU de la tolva NVIDIA en múltiples centros de datos, que cuesta alrededor de $ 1.6 mil millones en servidores y $ 944 millones en gastos operativos. Esta infraestructura respalda no solo la capacitación de IA sino también la investigación y el modelado financiero.
Como subsidiaria del Fondo de cobertura chino High-Flyer, Deepseek se beneficia de ser autofinanciado y ser propietario de sus centros de datos, lo que mejora su control sobre la optimización del modelo de IA y acelera la innovación. La estructura compacta de la compañía, combinada con altos salarios que atraen al máximo talento de las principales universidades chinas, permite la implementación ágil y efectiva de los avances de IA.
Si bien Deepseek ha invertido más de $ 500 millones en desarrollo de IA desde su inicio, su reclamo de un "presupuesto revolucionario" parece exagerado al considerar el contexto más amplio de sus inversiones y costos de infraestructura. No obstante, el enfoque de Deepseek demuestra que una compañía de IA independiente bien financiada puede competir con los gigantes de la industria, incluso si sus costos siguen siendo más bajos que los de competidores como ChatGPT4O, que gastó $ 100 millones en capacitación.
Imagen: ensigame.com
Imagen: ensigame.com
Imagen: ensigame.com
Imagen: ensigame.com
- 1 El estilo retro Arcade Racer Victory Heat Rally llega a Android Jan 05,2025
- 2 Honkai: Star Rail La filtración revela el cono de luz característico de Tribbie Jan 07,2025
- 3 Fenómenos Pokémon: ¡Se revela la supremacía acuática! Jan 10,2025
- 4 Teppen, el loco juego de cartas cruzado de Capcom y GungHo, celebra su quinto aniversario Jan 06,2025
- 5 La intergaláctica está en llamas. Después de dos semanas, las críticas al tráiler de Naughty Dog no han amainado Jan 05,2025
- 6 La lista de trabajos de Persona surge en medio de especulaciones sobre Persona 6 Jan 04,2025
- 7 ¡Tácticas abren preinscripción con abundantes recompensas! Dec 28,2024
- 8 Encuentra monstruos nostálgicos en Ragnarok Idle Adventure CBT Jan 09,2025
-
Las principales tendencias de belleza para esta temporada
Un total de 10
-
Juegos de arcade adictivos para dispositivos móviles
Un total de 10