DeepSeek AI Development стоит 1,6 млрд. Долл.
DeepSeek, известный китайский стартап, стал грозным конкурентом на рынке искусственного интеллекта, что особенно влияет на цены Nvidia на акции с его инновационным подходом. Чатбот компании представляет себя убедительным обещанием: «Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас». Это утверждение отражает амбиции DeepSeek по расширению границ возможностей ИИ.
Уникальные архитектуры и методы обучения моделей Deepseek отличают их. Одной из ключевых технологий является многотокерный прогноз (MTP) , который позволяет модели одновременно предсказывать несколько слов, повышая как точность, так и эффективность. Другим инновацией является смесь подхода экспертов (MOE) , используя 256 нейронных сетей в DeepSeek V3, с восемью активированными на токен, повышающие скорость и производительность обработки. Кроме того, мульти-головное скрытое внимание (MLA) фокусируется на важных элементах предложения, снижая вероятность пропустить важные детали и улучшить способность модели захватывать нюансы.
Несмотря на претензию Deepseek потратить всего 6 миллионов долларов на обучение своей мощной нейронной сети, Deepseek V3, дальнейшее расследование показывает более существенные инвестиции. Компания управляет значительной вычислительной инфраструктурой, в том числе около 50 000 графических процессоров Nvidia Hopper в нескольких центрах обработки данных, стоимостью около 1,6 млрд. Долл. США на серверах и 944 млн. Долл. США на эксплуатационные расходы. Эта инфраструктура поддерживает не только обучение искусственного интеллекта, но и исследование и финансовое моделирование.
Как дочерняя компания китайского хедж-фонда, DeepSeek выигрывает от самофинансирования и владения своими центрами обработки данных, что усиливает его контроль над оптимизацией модели искусственного интеллекта и ускоряет инновации. Компактная структура компании, в сочетании с высокой заработной платой, привлеченными к лучшим талантам от ведущих китайских университетов, обеспечивает гибкую и эффективную реализацию достижений искусственного интеллекта.
В то время как DeepSeek инвестировала более 500 миллионов долларов в развитие ИИ с момента его создания, его утверждение о «революционном бюджете» кажется переоцененным при рассмотрении более широкого контекста его инвестиций и затрат на инфраструктуру. Тем не менее, подход DeepSeek демонстрирует, что хорошо финансируемая независимая компания по искусству может конкурировать с отраслевыми гигантами, даже если их расходы остаются ниже, чем у конкурентов, таких как CHATGPT4O, которые потратили 100 миллионов долларов на обучение.
Изображение: Ensigame.com
Изображение: Ensigame.com
Изображение: Ensigame.com
Изображение: Ensigame.com
- 1 Аркадная гонка в ретро-стиле Victory Heat Rally выходит на Android Jan 05,2025
- 2 Honkai: Star Rail Утечка раскрывает фирменный световой конус Трибби Jan 07,2025
- 3 Феномены покемонов: раскрыто водное превосходство! Jan 10,2025
- 4 Безумная карточная игра-кроссовер Teppen от Capcom и GungHo празднует свое пятилетие Jan 06,2025
- 5 «Интергалактика» в огне. Спустя две недели критика в адрес трейлера Naughty Dog не утихла Jan 05,2025
- 6 Список вакансий в Persona появился на фоне спекуляций о Persona 6 Jan 04,2025
- 7 Открытая предварительная регистрация Tactics с множеством наград! Dec 28,2024
- 8 Встреча с ностальгическими монстрами в ЗБТ Ragnarok Idle Adventure Jan 09,2025