Pembangunan DeepSeek AI berharga $ 1.6 bilion, membatalkan mitos kemampuan
Deepseek, permulaan Cina yang terkenal, telah muncul sebagai pesaing yang hebat di pasaran AI, terutamanya memberi kesan kepada harga saham Nvidia dengan pendekatan inovatifnya. Chatbot syarikat memperkenalkan dirinya dengan janji yang menarik: "Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda." Kenyataan ini mencerminkan cita -cita DeepSeek untuk menolak sempadan keupayaan AI.
Kaedah seni bina dan latihan unik model DeepSeek membezakannya. Salah satu teknologi utama ialah Ramalan Multi-Token (MTP) , yang membolehkan model meramalkan beberapa perkataan secara serentak, meningkatkan ketepatan dan kecekapan. Satu lagi inovasi ialah pendekatan Campuran Pakar (MOE) , menggunakan 256 rangkaian saraf di Deepseek V3, dengan lapan di aktifkan setiap token, meningkatkan kelajuan dan prestasi pemprosesan. Di samping itu, Perhatian Laten Multi-Head (MLA) memberi tumpuan kepada unsur-unsur kalimat yang penting, mengurangkan peluang kehilangan butiran penting dan meningkatkan keupayaan model untuk menangkap nuansa.
Walaupun tuntutan Deepseek hanya membelanjakan $ 6 juta untuk melatih rangkaian saraf mereka yang kuat, DeepSeek V3, siasatan lanjut mendedahkan pelaburan yang lebih besar. Syarikat ini mengendalikan infrastruktur pengiraan yang signifikan, termasuk kira -kira 50,000 NVIDIA Hopper GPU di pelbagai pusat data, dengan harga sekitar $ 1.6 bilion dalam pelayan dan $ 944 juta dalam perbelanjaan operasi. Infrastruktur ini menyokong bukan sahaja latihan AI tetapi juga penyelidikan dan pemodelan kewangan.
Sebagai anak syarikat dana lindung nilai Cina yang tinggi, manfaat DeepSeek daripada dibiayai sendiri dan memiliki pusat datanya, yang meningkatkan kawalannya terhadap pengoptimuman model AI dan mempercepatkan inovasi. Struktur padat syarikat, digabungkan dengan gaji tinggi yang menarik bakat teratas dari universiti -universiti China yang terkemuka, membolehkan pelaksanaan AI yang tangkas dan berkesan.
Walaupun Deepseek telah melabur lebih daripada $ 500 juta dalam pembangunan AI sejak penubuhannya, tuntutannya "bajet revolusioner" nampaknya terlalu berlebihan apabila mempertimbangkan konteks yang lebih luas mengenai pelaburan dan kos infrastrukturnya. Walau bagaimanapun, pendekatan DeepSeek menunjukkan bahawa syarikat AI yang dibiayai dengan baik dan bebas dapat bersaing dengan gergasi industri, walaupun kos mereka tetap lebih rendah daripada pesaing seperti Chatgpt4o, yang membelanjakan $ 100 juta untuk latihan.
Imej: ensigame.com
Imej: ensigame.com
Imej: ensigame.com
Imej: ensigame.com
- 1 Himpunan Haba Kemenangan Pelumba Arked Gaya Retro Dijatuhkan Pada Android Jan 05,2025
- 2 Honkai: Star Rail Kebocoran Mendedahkan Kon Cahaya Tanda Tangan Tribbie Jan 07,2025
- 3 Pokémon Phenoms: Ketuanan Akuatik Didedahkan! Jan 10,2025
- 4 Permainan kad silang Capcom dan GungHo yang gila Teppen sedang meraikan ulang tahun kelimanya Jan 06,2025
- 5 Intergalaksi sedang terbakar. Selepas dua minggu, kritikan terhadap treler Naughty Dog masih belum reda Jan 05,2025
- 6 Penyenaraian Pekerjaan Persona Turun Di Tengah-tengah Spekulasi Persona 6 Jan 04,2025
- 7 Taktik Buka Pra-Pendaftaran dengan Ganjaran Berlimpah! Dec 28,2024
- 8 Temui Raksasa Nostalgia dalam Ragnarok Idle Adventure CBT Jan 09,2025
-
Trend kecantikan teratas untuk musim ini
Sebanyak 10
-
Permainan arked ketagihan untuk mudah alih
Sebanyak 10