DeepSeek AI开发的费用为16亿美元,揭穿了负担能力神话
DeepSeek是一家著名的中国初创公司,已成为AI市场中强大的竞争对手,特别是通过其创新方法影响了Nvidia的股票价格。该公司的聊天机器人以一个令人信服的承诺向自己介绍:“嗨,我被创建了,所以您可以问任何东西,并得到一个甚至可能让您感到惊讶的答案。”该声明反映了DeepSeek的野心推动AI功能的界限。
DeepSeek模型的独特架构和培训方法使它们与众不同。关键技术之一是多言论预测(MTP) ,该预测允许模型同时预测多个单词,从而提高了准确性和效率。另一个创新是专家(MOE)方法的混合,利用DeepSeek V3中的256个神经网络,每个令牌八个激活,增强了处理速度和性能。此外,多头潜在注意力(MLA)着重于关键的句子元素,减少了缺少重要细节的机会并提高模型捕获细微差别的能力。
尽管DeepSeek声称只花了600万美元来培训其强大的神经网络,但DeepSeek V3的进一步调查表明,投资更为实质性。该公司运营着重要的计算基础设施,其中包括多个数据中心的约50,000个NVIDIA HOPPER GPU,耗资约16亿美元的服务器和9.44亿美元的运营费用。这些基础设施不仅支持AI培训,还支持研究和财务建模。
作为中国对冲基金高级基金的子公司,DeepSeek受益于自我资助和拥有其数据中心,从而增强了对AI模型优化的控制权,并加快了创新的速度。该公司的紧凑型结构,加上高薪的高薪,吸引了中国领先的大学的顶尖人才,可以敏捷而有效地实施AI的进步。
尽管DeepSeek自成立以来已经投资了超过5亿美元的人工智能开发,但考虑到其投资和基础设施成本的更广泛背景时,其对“革命预算”的主张似乎被夸大了。尽管如此,DeepSeek的方法表明,一家资金充足,独立的AI公司确实可以与行业巨头竞争,即使他们的成本仍然低于诸如Chatgpt4O之类的竞争对手,而Chatgpt4o的成本则花费了1亿美元。
图片:ensigame.com
图片:ensigame.com
图片:ensigame.com
图片:ensigame.com
- 1 复古风格街机赛车胜利热火拉力赛登陆 Android Jan 05,2025
- 2 崩坏:星穹铁道 泄漏揭示了 Tribbie 的标志性光锥 Jan 07,2025
- 3 精灵宝可梦:水生霸主揭晓! Jan 10,2025
- 4 Capcom 和 GungHo 的疯狂交叉卡牌游戏 Teppen 正在庆祝其五周年 Jan 06,2025
- 5 星际间着火了。两周过去了,顽皮狗预告片的批评仍未平息 Jan 05,2025
- 6 《女神异闻录 6》的猜测中突然出现了《女神异闻录 6》的职位列表 Jan 04,2025
- 7 战术开放预注册,奖励丰厚! Dec 28,2024
- 8 在 Ragnarok Idle Adventure CBT 中遭遇怀旧怪物 Jan 09,2025