DeepSeek V4 Model विस्तृत विवरण: पैरामीटर स्केल, क्षमताएँ और प्रदर्शन
DeepSeek V4 Modeldeepseek v4DeepSeek V4बड़ा भाषा मॉडल
DeepSeek V4 Model ने लंबे संदर्भ को मिलियन-स्तर तक पहुँचाया है और मूल बहु-मोडल क्षमता तथा एक नए आर्किटेक्चर को पेश किया है। यह लेख DeepSeek V4 के पैरामीटर स्केल, क्षमताओं और प्रदर्शन का संक्षिप्त विस्तृत विवरण प्रस्तुत करता है।

1. पैरामीटर और आर्किटेक्चर
- स्केल: V4 पूर्ण संस्करण लगभग 1 ट्रिलियन पैरामीटर MoE, सक्रिय पैरामीटर लगभग 32 बिलियन; V4 Lite लगभग 200B, जारी किया गया है।
- संदर्भ: 128K से बढ़ाकर 10 लाख टोकन तक, पूरे डेटाबेस, लंबे दस्तावेज़, बहु-चरण Agent के लिए अधिक उपयोगी।
- आर्किटेक्चर: Engram सशर्त मेमोरी, DSA विरल ध्यान, mHC सुधारित हाइपरकनेक्शन, लंबे संदर्भ में लागत नियंत्रण और स्थिरता सुधार।
2. क्षमता के मुख्य बिंदु
- मूल बहु-मोडल: पाठ, छवि, वीडियो एकीकृत मॉडलिंग, पाठ-से-छवि, पाठ-से-वीडियो और क्रॉस-मोडल तर्क समर्थन।
- कोड: रिपोर्ट किए गए SWE-bench Verified लगभग 83.7%, इंजीनियरिंग वैश्विक सोच से लैस।
- लागत: प्रतिस्पर्धियों की तुलना में अनुमान लागत में लाभ, 7×24 Agent और बड़े पैमाने पर अनुप्रयोगों के लिए अनुकूल।
3. V4 Lite और पूर्ण संस्करण
वर्तमान में V4 Lite जारी किया गया है; पूर्ण संस्करण के उच्चतर पैरामीटर संख्या और क्षमताओं की उम्मीद है, विवरण आधिकारिक स्रोतों के अनुसार। DeepSeek V4 Model का रोडमैप लंबा संदर्भ + मूल बहु-मोडल + लागत दक्षता है।
DeepSeek V4 को सीधे अनुभव करना चाहते हैं, तो नीचे दिए गए बटन पर क्लिक करें।