DeepSeek V4 Model Detaylı Açıklama: Parametre Ölçeği, Yetenekler ve Performans
DeepSeek V4 Modeldeepseek v4DeepSeek V4büyük dil modeli
DeepSeek V4 Model, uzun bağlamı milyonlarca tokana çıkarırken yerel çoklu modalite ve yepyeni bir mimariyi tanıtıyor. Bu makale, DeepSeek V4’ün parametre ölçeği, yetenekleri ve performansı hakkında kısa ve detaylı bir açıklama sunuyor.

1. Parametreler ve Mimari
- Ölçek: V4 tam sürüm yaklaşık 1 trilyon parametreli MoE, aktif parametreler yaklaşık 32 milyar; V4 Lite yaklaşık 200B, yayınlandı.
- Bağlam: 128K’dan 1 milyon token’a yükseltildi, tüm veritabanları, uzun belgeler, çoklu tur Agent’lar için daha kullanılabilir.
- Mimari: Engram koşullu bellek, DSA seyrek dikkat, mHC geliştirilmiş hiper bağlantı, uzun bağlam altında maliyeti kontrol eder, kararlılığı artırır.
2. Yetenek Özeti
- Yerel Çoklu Modalite: Metin, görüntü, video birleşik modelleme, metinden görüntü, metinden video ve çapraz modalite akıl yürütmeyi destekler.
- Kod: Sızdırılan SWE-bench Verified yaklaşık %83.7, mühendisliksel global düşünceye sahip.
- Maliyet: Rakip ürünlere göre çıkarım maliyeti avantajlı, 7×24 Agent ve ölçeklenebilir uygulamalar için uygun.
3. V4 Lite ve Tam Sürüm
Şu anda V4 Lite yayınlandı; tam sürümün daha yüksek parametre sayısı ve yeteneklere sahip olması bekleniyor, detaylar için lütfen resmi açıklamalara bakın. DeepSeek V4 Model’in yolu uzun bağlam + yerel çoklu modalite + maliyet verimliliğidir.
DeepSeek V4’ü doğrudan deneyimlemek istiyorsanız, aşağıdaki butona tıklayabilirsiniz.