DeepSeek AI開發的費用為16億美元,揭穿了負擔能力神話
DeepSeek是一家著名的中國初創公司,已成為AI市場中強大的競爭對手,特別是通過其創新方法影響了Nvidia的股票價格。該公司的聊天機器人以一個令人信服的承諾向自己介紹:“嗨,我被創建了,所以您可以問任何東西,並得到一個甚至可能讓您感到驚訝的答案。”該聲明反映了DeepSeek的野心推動AI功能的界限。
DeepSeek模型的獨特架構和培訓方法使它們與眾不同。關鍵技術之一是多言論預測(MTP) ,該預測允許模型同時預測多個單詞,從而提高了準確性和效率。另一個創新是專家(MOE)方法的混合,利用DeepSeek V3中的256個神經網絡,每個令牌八個激活,增強了處理速度和性能。此外,多頭潛在註意力(MLA)著重於關鍵的句子元素,減少了缺少重要細節的機會並提高模型捕獲細微差別的能力。
儘管DeepSeek聲稱只花了600萬美元來培訓其強大的神經網絡,但DeepSeek V3的進一步調查表明,投資更為實質性。該公司運營著重要的計算基礎設施,其中包括多個數據中心的約50,000個NVIDIA HOPPER GPU,耗資約16億美元的服務器和9.44億美元的運營費用。這些基礎設施不僅支持AI培訓,還支持研究和財務建模。
作為中國對沖基金高級基金的子公司,DeepSeek受益於自我資助和擁有其數據中心,從而增強了對AI模型優化的控制權,並加快了創新的速度。該公司的緊湊型結構,加上高薪的高薪,吸引了中國領先的大學的頂尖人才,可以敏捷而有效地實施AI的進步。
儘管DeepSeek自成立以來已經投資了超過5億美元的人工智能開發,但考慮到其投資和基礎設施成本的更廣泛背景時,其對“革命預算”的主張似乎被誇大了。儘管如此,DeepSeek的方法表明,一家資金充足,獨立的AI公司確實可以與行業巨頭競爭,即使他們的成本仍然低於諸如Chatgpt4O之類的競爭對手,而Chatgpt4o的成本則花費了1億美元。
圖片:ensigame.com
圖片:ensigame.com
圖片:ensigame.com
圖片:ensigame.com
- 1 複古風格街機賽車勝利熱火拉力賽登陸 Android Jan 05,2025
- 2 崩壞:星穹鐵道 洩漏揭示了 Tribbie 的標誌性光錐 Jan 07,2025
- 3 精靈寶可夢:水生霸主揭曉! Jan 10,2025
- 4 Capcom 和 GungHo 的瘋狂交叉卡牌遊戲 Teppen 正在慶祝其五周年 Jan 06,2025
- 5 星際間著火了。兩周過去了,頑皮狗預告片的批評仍未平息 Jan 05,2025
- 6 《女神異聞錄 6》的猜測中突然出現了《女神異聞錄 6》的職位列表 Jan 04,2025
- 7 戰術開放預注冊,獎勵豐厚! Dec 28,2024
- 8 在 Ragnarok Idle Adventure CBT 中遭遇懷舊怪物 Jan 09,2025