DeepSeek V4 Model Detaljerad Förklaring: Parameterstorlek, Förmågor och Prestanda
DeepSeek V4 Model driver lång kontext till miljontalsnivå och introducerar inbyggd multimodalitet med en helt ny arkitektur. Den här artikeln ger en kortfattad detaljerad förklaring av DeepSeek V4s parameterstorlek, förmågor och prestanda.

1. Parametrar och Arkitektur
- Storlek: V4 fullversion är cirka 1 biljon parametrar MoE, med cirka 32 miljarder aktiverade parametrar; V4 Lite är cirka 200B och har släppts.
- Kontext: Ökad från 128K till 1 miljon tokens, vilket gör hela databaser, långa dokument och flerrundors Agent mer användbara.
- Arkitektur: Engram villkorligt minne, DSA gles uppmärksamhet, mHC förbättrad hyperanslutning, kontrollerar kostnader och förbättrar stabilitet vid lång kontext.
2. Nyckelförmågor
- Inbyggd multimodalitet: Enhetlig modellering av text, bilder och video, stöder text-till-bild, text-till-video och tvär-modalt resonemang.
- Kod: Läckt SWE-bench Verified cirka 83.7%, har globalt ingenjörstänk.
- Kostnad: Fördelaktiga inferenskostnader jämfört med konkurrenter, gynnar 7×24 Agent och skalbar tillämpning.
3. V4 Lite och Fullversion
För närvarande har V4 Lite släppts; fullversionen förväntas ha högre parameterantal och förmågor, specifika detaljer följer officiella meddelanden. DeepSeek V4 Models väg är lång kontext + inbyggd multimodalitet + kostnadseffektivitet.
Vill du prova DeepSeek V4 direkt? Klicka på knappen nedan.