DeepSeek AI開發的費用為16億美元,揭穿了負擔能力神話
DeepSeek是一家著名的中國初創公司,已成為AI市場中強大的競爭對手,特別是通過其創新方法影響了Nvidia的股票價格。該公司的聊天機器人以一個令人信服的承諾向自己介紹:“嗨,我被創建了,所以您可以問任何東西,並得到一個甚至可能讓您感到驚訝的答案。”該聲明反映了DeepSeek的野心推動AI功能的界限。
DeepSeek模型的獨特架構和培訓方法使它們與眾不同。關鍵技術之一是多言論預測(MTP) ,該預測允許模型同時預測多個單詞,從而提高了準確性和效率。另一個創新是專家(MOE)方法的混合,利用DeepSeek V3中的256個神經網絡,每個令牌八個激活,增強了處理速度和性能。此外,多頭潛在註意力(MLA)著重於關鍵的句子元素,減少了缺少重要細節的機會並提高模型捕獲細微差別的能力。
儘管DeepSeek聲稱只花了600萬美元來培訓其強大的神經網絡,但DeepSeek V3的進一步調查表明,投資更為實質性。該公司運營著重要的計算基礎設施,其中包括多個數據中心的約50,000個NVIDIA HOPPER GPU,耗資約16億美元的服務器和9.44億美元的運營費用。這些基礎設施不僅支持AI培訓,還支持研究和財務建模。
作為中國對沖基金高級基金的子公司,DeepSeek受益於自我資助和擁有其數據中心,從而增強了對AI模型優化的控制權,並加快了創新的速度。該公司的緊湊型結構,加上高薪的高薪,吸引了中國領先的大學的頂尖人才,可以敏捷而有效地實施AI的進步。
儘管DeepSeek自成立以來已經投資了超過5億美元的人工智能開發,但考慮到其投資和基礎設施成本的更廣泛背景時,其對“革命預算”的主張似乎被誇大了。儘管如此,DeepSeek的方法表明,一家資金充足,獨立的AI公司確實可以與行業巨頭競爭,即使他們的成本仍然低於諸如Chatgpt4O之類的競爭對手,而Chatgpt4o的成本則花費了1億美元。
圖片:ensigame.com
圖片:ensigame.com
圖片:ensigame.com
圖片:ensigame.com
- 1 Fortnite:第6章第1季NPC地點 Feb 13,2025
- 2 六人的美食之旅蓬勃發展 Jan 01,2025
- 3 Pokémon Go 用節日煙花等慶祝 2025 年新年! Jan 03,2025
- 4 Roblox:貓武士: Ultimate Edition 代碼(2025 年 1 月) Feb 12,2025
- 5 征服Dragon Quest III的提示:HD-2D翻拍 Feb 21,2025
- 6 Roblox遊戲代碼更新:2025年4月 May 13,2025
- 7 如何修複公共漫威競爭對手錯誤代碼 Feb 20,2025
- 8 Pokémon GO>節2025年:節日,位置,細節顯示 Feb 13,2025
-
本季的最佳美容趨勢
總共 10
-
各種樣式的唯一壁紙應用
總共 10
-
Android的終極棒球遊戲
總共 10