Rumah News > Pembangunan DeepSeek AI berharga $ 1.6 bilion, membatalkan mitos kemampuan

Pembangunan DeepSeek AI berharga $ 1.6 bilion, membatalkan mitos kemampuan

by Claire Apr 18,2025

Deepseek, permulaan Cina yang terkenal, telah muncul sebagai pesaing yang hebat di pasaran AI, terutamanya memberi kesan kepada harga saham Nvidia dengan pendekatan inovatifnya. Chatbot syarikat memperkenalkan dirinya dengan janji yang menarik: "Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda." Kenyataan ini mencerminkan cita -cita DeepSeek untuk menolak sempadan keupayaan AI.

Kaedah seni bina dan latihan unik model DeepSeek membezakannya. Salah satu teknologi utama ialah Ramalan Multi-Token (MTP) , yang membolehkan model meramalkan beberapa perkataan secara serentak, meningkatkan ketepatan dan kecekapan. Satu lagi inovasi ialah pendekatan Campuran Pakar (MOE) , menggunakan 256 rangkaian saraf di Deepseek V3, dengan lapan di aktifkan setiap token, meningkatkan kelajuan dan prestasi pemprosesan. Di samping itu, Perhatian Laten Multi-Head (MLA) memberi tumpuan kepada unsur-unsur kalimat yang penting, mengurangkan peluang kehilangan butiran penting dan meningkatkan keupayaan model untuk menangkap nuansa.

Walaupun tuntutan Deepseek hanya membelanjakan $ 6 juta untuk melatih rangkaian saraf mereka yang kuat, DeepSeek V3, siasatan lanjut mendedahkan pelaburan yang lebih besar. Syarikat ini mengendalikan infrastruktur pengiraan yang signifikan, termasuk kira -kira 50,000 NVIDIA Hopper GPU di pelbagai pusat data, dengan harga sekitar $ 1.6 bilion dalam pelayan dan $ 944 juta dalam perbelanjaan operasi. Infrastruktur ini menyokong bukan sahaja latihan AI tetapi juga penyelidikan dan pemodelan kewangan.

Sebagai anak syarikat dana lindung nilai Cina yang tinggi, manfaat DeepSeek daripada dibiayai sendiri dan memiliki pusat datanya, yang meningkatkan kawalannya terhadap pengoptimuman model AI dan mempercepatkan inovasi. Struktur padat syarikat, digabungkan dengan gaji tinggi yang menarik bakat teratas dari universiti -universiti China yang terkemuka, membolehkan pelaksanaan AI yang tangkas dan berkesan.

Walaupun Deepseek telah melabur lebih daripada $ 500 juta dalam pembangunan AI sejak penubuhannya, tuntutannya "bajet revolusioner" nampaknya terlalu berlebihan apabila mempertimbangkan konteks yang lebih luas mengenai pelaburan dan kos infrastrukturnya. Walau bagaimanapun, pendekatan DeepSeek menunjukkan bahawa syarikat AI yang dibiayai dengan baik dan bebas dapat bersaing dengan gergasi industri, walaupun kos mereka tetap lebih rendah daripada pesaing seperti Chatgpt4o, yang membelanjakan $ 100 juta untuk latihan.

Ujian DeepSeek Imej: ensigame.com