DeepSeek AI Development의 비용은 16 억 달러로 경제성 신화를 폭로했습니다
저명한 중국 스타트 업인 Deepseek은 AI 시장에서 강력한 경쟁자로 부상하여 Nvidia의 주가에 혁신적인 접근 방식에 영향을 미쳤습니다. 회사의 챗봇은 "안녕하세요, 나는 당신이 무엇이든 물어보고 당신을 놀라게 할 수있는 대답을 얻을 수 있도록 만들어졌습니다." 이 진술은 AI 기능의 경계를 추진하려는 Deepseek의 야망을 반영합니다.
DeepSeek 모델의 독특한 건축 및 훈련 방법은 그것들을 차별화시켰다. 주요 기술 중 하나는 MTP (Multi-Token Prediction) 로, 모델이 여러 단어를 동시에 예측하여 정확도와 효율성을 모두 향상시킬 수 있습니다. 또 다른 혁신은 Deepseek V3의 256 개의 신경망을 활용하여 8 개의 활성화 된 토큰 및 성능을 향상시키는 전문가 (MOE) 접근법의 혼합 입니다. 또한 MLA (Multi-Head Prenatent Treate)는 중요한 문장 요소에 중점을 두어 중요한 세부 사항이 누락 될 가능성을 줄이고 모델의 뉘앙스를 포착 할 수있는 능력을 향상시킵니다.
Deepseek V3를 훈련시키기 위해 6 백만 달러 만 지출 한 Deepseek의 주장에도 불구하고 추가 조사에 따르면 더 많은 투자가 밝혀졌습니다. 이 회사는 여러 데이터 센터에서 약 50,000 개의 NVIDIA HOPPER GPU를 포함하여 상당한 계산 인프라를 운영하며, 서버는 약 16 억 달러, 운영 비용은 9,440 만 달러입니다. 이 인프라는 AI 교육뿐만 아니라 연구 및 재무 모델링도 지원합니다.
중국 헤지 펀드가 높은 비행의 자회사로서, Deepseek는 자체 자금을 지원하고 데이터 센터를 소유함으로써 AI 모델 최적화에 대한 제어를 향상시키고 혁신을 가속화함으로써 혜택을받습니다. 이 회사의 소형 구조는 주요 중국 대학에서 최고의 인재를 유치하는 높은 급여와 결합하여 AI 발전을 민첩하고 효과적으로 구현할 수 있습니다.
DeepSeek은 창립 이후 AI 개발에 5 억 달러 이상을 투자했지만 "혁명 예산"에 대한 주장은 투자 및 인프라 비용의 더 넓은 맥락을 고려할 때 과장된 것으로 보입니다. 그럼에도 불구하고 DeepSeek의 접근 방식은 잘 자금을 지원 받고 독립적 인 AI 회사가 ChatGPT4O와 같은 경쟁 업체의 비용보다 비용이 저렴하더라도 업계 거인과 실제로 경쟁 할 수 있음을 보여줍니다.
이미지 : ensigame.com
이미지 : ensigame.com
이미지 : ensigame.com
이미지 : ensigame.com
- 1 복고풍 스타일의 아케이드 레이서 승리 히트 랠리가 안드로이드에 등장합니다 Jan 05,2025
- 2 붕괴: 스타레일 Leak, Tribbie의 시그니처 라이트 콘 공개 Jan 07,2025
- 3 포켓몬 신동: 수중 패권 공개! Jan 10,2025
- 4 Capcom과 GungHo의 미친 크로스오버 카드 게임 Teppen이 5주년을 맞이했습니다. Jan 06,2025
- 5 은하계에 불이 붙었습니다. 2주가 지나도 Naughty Dog의 예고편에 대한 비판은 가라앉지 않았습니다. Jan 05,2025
- 6 페르소나 6 추측 속에서 페르소나 채용 목록이 갑자기 등장 Jan 04,2025
- 7 택틱스 오픈 사전등록하고 풍성한 보상을 받으세요! Dec 28,2024
- 8 라그나로크 방치형 어드벤처 CBT에서 향수를 불러일으키는 몬스터들을 만나보세요 Jan 09,2025