Deepseek AI開発の費用は16億ドルで、手頃な価格の神話を暴きます
中国の著名な新興企業であるDeepseekは、AI市場で恐ろしい競合他社として浮上し、特に革新的なアプローチでNvidiaの株価に影響を与えています。会社のチャットボットは、「こんにちは、私はあなたが何でも尋ねて、あなたを驚かせるかもしれない答えを得ることができるように作成されたという説得力のある約束で自己紹介しています。この声明は、AI能力の境界を押し広げるDeepseekの野望を反映しています。
Deepseekのモデルのユニークなアーキテクチャとトレーニング方法は、それらを際立たせています。重要なテクノロジーの1つは、マルチトークン予測(MTP)です。これにより、モデルは複数の単語を同時に予測できるようになり、精度と効率の両方が向上します。もう1つの革新は、Deepseek V3で256のニューラルネットワークを利用して、トークンごとに8つの活性化を行い、処理速度とパフォーマンスを向上させる専門家(MOE)アプローチの混合です。さらに、マルチヘッドの潜在的な注意(MLA)は、重要な文化要素に焦点を当て、重要な詳細を見逃す可能性を減らし、ニュアンスをキャプチャするモデルの能力を向上させます。
強力なニューラルネットワークであるDeepseek V3を訓練するためにわずか600万ドルを費やしたというDeepseekの主張にもかかわらず、さらなる調査により、より多額の投資が明らかになりました。同社は、複数のデータセンターにわたって約50,000のNVIDIAホッパーGPUを含む重要な計算インフラストラクチャを運営しており、サーバーで約16億ドル、9億4,400万ドルの運用費用がかかります。このインフラストラクチャは、AIトレーニングだけでなく、研究と財務モデリングもサポートしています。
中国のヘッジファンドのハイフライヤーの子会社として、DeepSeekは自己資金を提供し、データセンターを所有することで利益を得ており、AIモデルの最適化とイノベーションの制御を強化します。同社のコンパクトな構造は、中国の主要な大学からのトップの才能を引き付ける高い給与と相まって、AIの進歩の機敏で効果的な実施を可能にします。
Deepseekは、設立以来AI開発に5億ドル以上を投資してきましたが、「革新的な予算」の主張は、投資とインフラコストのより広い文脈を検討する際に誇張されているようです。それにもかかわらず、Deepseekのアプローチは、資金提供された独立したAI企業が、トレーニングに1億ドルを費やしたChatGPT4Oのような競合他社のコストよりも低いままであっても、業界の巨人と実際に競争できることを示しています。
画像:Ensigame.com
画像:Ensigame.com
画像:Ensigame.com
画像:Ensigame.com
- 1 レトロなスタイルのアーケード レーサー Victory Heat Rally が Android に登場 Jan 05,2025
- 2 崩壊:スターレイル リークによりトリビーの特徴的なライトコーンが明らかに Jan 07,2025
- 3 ポケモンの現象:水生の優位性が明らかに! Jan 10,2025
- 4 カプコンとガンホーの狂気のクロスオーバー カード ゲーム Teppen が 5 周年を迎えます Jan 06,2025
- 5 インターギャラクティックは燃えています。 2週間経ってもノーティードッグの予告編に対する批判は収まらない Jan 05,2025
- 6 ペルソナ6の憶測の中でペルソナの求人情報が浮上 Jan 04,2025
- 7 タクティクスは事前登録を開始し、報酬が豊富にあります! Dec 28,2024
- 8 Ragnarok Idle Adventure CBT で懐かしいモンスターに遭遇 Jan 09,2025
-
モバイルのための中毒性のアーケードゲーム
合計 10