10 April, DeepSeek resmi blog mengeluarkan artikel yang memperkenalkan DeepSeek V4, model flagship yang akan diluncurkan oleh perusahaan DeepSeek. Model ini tidak hanya melampaui batas skala parameter, tetapi juga menjanjikan efisiensi yang belum pernah terjadi sebelumnya. Diperkirakan DeepSeek V4 mampu memproses 1 triliun (1T) parameter, secara native mendukung data multimodal, termasuk teks, gambar, video, dan audio, serta memiliki jendela konteks sebesar 1 juta token (setara dengan 15-20 novel lengkap), menjadikannya pesaing langsung terhadap raksasa Barat seperti GPT-5.4 dari OpenAI dan Claude Opus 4.5 dari Anthropic. Harga API untuk DeepSeek V4 10-50 kali lebih murah dibandingkan GPT-5.4 dan Claude Opus 4.5; diperkirakan DeepSeek V4 akan dirilis dengan kode sumber terbuka di bawah lisensi Apache 2.0. DeepSeek V4 dapat berjalan secara lokal di sistem dengan dua RTX 4090 atau satu RTX 5090. Selain itu, DeepSeek memperkenalkan tiga inovasi revolusioner untuk DeepSeek V4: 1. Memori engram; 2. Hyperkoneksi terbatas beragam (mHC); 3. Mekanisme perhatian jarang (DSA) dan indeksor Lightning. Lebih jauh lagi, dalam pernyataan resmi, DeepSeek menyebutkan bahwa karena pembatasan ekspor ketat AS terhadap GPU berkualitas tinggi NVIDIA (seperti B300 dan H200), DeepSeek mengoptimalkan V4 agar bergantung terutama pada chip yang diproduksi di China, untuk output. Meskipun pelatihan awal masih dapat menggunakan perangkat NVIDIA (misalnya, H800), model ini sangat dioptimalkan untuk chip Huawei Ascend 950PR dan Cambricon MLU.

Lihat Asli
post-image
post-image
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan