首页 News > DeepSeek AI开发的费用为16亿美元,揭穿了负担能力神话

DeepSeek AI开发的费用为16亿美元,揭穿了负担能力神话

by Claire Apr 18,2025

DeepSeek是一家著名的中国初创公司,已成为AI市场中强大的竞争对手,特别是通过其创新方法影响了Nvidia的股票价格。该公司的聊天机器人以一个令人信服的承诺向自己介绍:“嗨,我被创建了,所以您可以问任何东西,并得到一个甚至可能让您感到惊讶的答案。”该声明反映了DeepSeek的野心推动AI功能的界限。

DeepSeek模型的独特架构和培训方法使它们与众不同。关键技术之一是多言论预测(MTP) ,该预测允许模型同时预测多个单词,从而提高了准确性和效率。另一个创新是专家(MOE)方法的混合,利用DeepSeek V3中的256个神经网络,每个令牌八个激活,增强了处理速度和性能。此外,多头潜在注意力(MLA)着重于关键的句子元素,减少了缺少重要细节的机会并提高模型捕获细微差别的能力。

尽管DeepSeek声称只花了600万美元来培训其强大的神经网络,但DeepSeek V3的进一步调查表明,投资更为实质性。该公司运营着重要的计算基础设施,其中包括多个数据中心的约50,000个NVIDIA HOPPER GPU,耗资约16亿美元的服务器和9.44亿美元的运营费用。这些基础设施不仅支持AI培训,还支持研究和财务建模。

作为中国对冲基金高级基金的子公司,DeepSeek受益于自我资助和拥有其数据中心,从而增强了对AI模型优化的控制权,并加快了创新的速度。该公司的紧凑型结构,加上高薪的高薪,吸引了中国领先的大学的顶尖人才,可以敏捷而有效地实施AI的进步。

尽管DeepSeek自成立以来已经投资了超过5亿美元的人工智能开发,但考虑到其投资和基础设施成本的更广泛背景时,其对“革命预算”的主张似乎被夸大了。尽管如此,DeepSeek的方法表明,一家资金充足,独立的AI公司确实可以与行业巨头竞争,即使他们的成本仍然低于诸如Chatgpt4O之类的竞争对手,而Chatgpt4o的成本则花费了1亿美元。

DeepSeek测试图片:ensigame.com

DeepSeek V3图片:ensigame.com

DeepSeek图片:ensigame.com

DeepSeek图片:ensigame.com

最新应用