توضیح مدل DeepSeek V4: مقیاس پارامترها، قابلیتها و عملکرد
مدل DeepSeek V4 زمینه متنی را به سطح میلیونی رسانده و چندوجهی بومی را همراه با معماری کاملاً جدید معرفی میکند. این مقاله به طور خلاصه به توضیح مقیاس پارامترها، قابلیتها و عملکرد DeepSeek V4 میپردازد.

۱. پارامترها و معماری
- مقیاس: نسخه کامل V4 حدود ۱ تریلیون پارامتر MoE با حدود ۳۲ میلیارد پارامتر فعال؛ نسخه V4 Lite حدود ۲۰۰B که منتشر شده است.
- زمینه متنی: از ۱۲۸K به ۱ میلیون توکن ارتقا یافته، که برای کل پایگاه داده، اسناد طولانی و Agent چندمرحلهای کاربردیتر است.
- معماری: حافظه شرطی Engram، توجه پراکنده DSA، ابراتصال بهبودیافته mHC که هزینهها را در زمینههای متنی طولانی کنترل کرده و پایداری را افزایش میدهد.
۲. نکات کلیدی قابلیتها
- چندوجهی بومی: مدلسازی یکپارچه متن، تصویر و ویدیو، با پشتیبانی از تولید تصویر از متن، تولید ویدیو از متن و استدلال چندوجهی.
- کدنویسی: نرخ تأیید شده SWE-bench حدود ۸۳.۷٪، دارای تفکر مهندسی جامع.
- هزینه: مزیت هزینه استنتاج نسبت به رقبا، مناسب برای Agentهای ۷×۲۴ و کاربردهای مقیاسپذیر.
۳. نسخه Lite و نسخه کامل
در حال حاضر V4 Lite منتشر شده است؛ انتظار میرود نسخه کامل دارای پارامترهای بیشتر و قابلیتهای بالاتری باشد، جزئیات دقیق بر اساس اعلام رسمی خواهد بود. مسیر مدل DeepSeek V4 بر زمینه متنی طولانی + چندوجهی بومی + کارایی هزینه متمرکز است.
برای تجربه مستقیم DeepSeek V4، میتوانید روی دکمه زیر کلیک کنید.