Pratinjau DeepSeek-V4: Memasuki Era Aksesibilitas Konteks Jutaan
Hari ini, versi pratinjau dari seri model совершенно baru DeepSeek-V4 secara resmi diluncurkan dan di-open-source-kan secara simultan.
DeepSeek-V4 menampilkan konteks ultra-panjang jutaan kata, memimpin di bidang domestik dan open-source dalam kapabilitas Agent, pengetahuan dunia, dan performa penalaran. Model ini dibagi menjadi dua versi berdasarkan ukuran:
Dari hari ini, Anda dapat mengobrol dengan DeepSeek-V4 terbaru di situs resmi untuk menjelajahi pengalaman baru memori konteks ultra-panjang 1M. Layanan API telah diperbarui secara simultan, dan Anda dapat memanggilnya dengan memodifikasi model_name ke deepseek-v4-pro atau deepseek-v4-flash.
DeepSeek-V4-Pro: Performa Sebanding dengan Model Closed-Source Teratas
Kapabilitas Agent yang secara signifikan ditingkatkan: Dibandingkan dengan model generasi sebelumnya, kapabilitas Agent DeepSeek-V4-Pro telah meningkat secara remarkable. Dalam evaluasi Agentic Coding, V4-Pro telah mencapai tingkat terbaik di antara model open-source saat ini, dan juga Perform dengan excellently dalam evaluasi terkait Agent lainnya. Saat ini, DeepSeek-V4 telah menjadi model Agentic Coding yang digunakan oleh karyawan internal. Menurut umpan balik evaluasi, pengalaman pengguna lebih baik dari Sonnet 4.5, dan kualitas pengiriman close to Opus 4.6 non-thinking mode, meskipun masih ada certain gap dengan Opus 4.6 thinking mode.
Pengetahuan dunia yang kaya: Dalam penilaian pengetahuan dunia, DeepSeek-V4-Pro significantly leads other open-source models, hanya sedikit inferior dari model closed-source teratas Gemini-Pro-3.1.
Performa penalaran kelas dunia: Dalam evaluasi matematika, STEM, dan kode tingkat kompetisi, DeepSeek-V4-Pro surpasses semua model open-source yang saat ini dievaluasi secara publik, mencapai hasil excellent yang sebanding dengan model closed-source top dunia.
DeepSeek-V4-Flash: Pilihan Lebih Cepat dan Lebih Hemat Biaya
Dibandingkan dengan DeepSeek-V4-Pro, DeepSeek-V4-Flash sedikit lebih rendah dalam cadangan pengetahuan dunia tetapi menunjukkan kapabilitas penalaran yang sebanding. Karena parameter model dan aktivasi yang lebih kecil, V4-Flash dapat menyediakan layanan API yang lebih cepat dan lebih hemat biaya.
Dalam evaluasi Agent, DeepSeek-V4-Flash setara dengan DeepSeek-V4-Pro dalam tugas-tugas sederhana tetapi masih memiliki kesenjangan dalam tugas-tugas with high difficulty.
Inovasi Struktural dan Efisiensi Konteks Ultra-Tinggi
DeepSeek-V4 telah memelopori совершенно baru mekanisme perhatian yang mengkompresi dalam dimensi token, dikombinasikan dengan DSA sparse attention (DeepSeek Sparse Attention), mencapai kapabilitas konteks panjang tingkat dunia dan secara signifikan mengurangi persyaratan komputasi dan memori dibandingkan dengan metode tradisional. Mulai sekarang, 1M (satu juta) konteks akan menjadi standar untuk semua layanan resmi DeepSeek.
Optimasi Khusus untuk Kapabilitas Agent
DeepSeek-V4 telah diadaptasi dan dioptimalkan untuk produk-produk Agent utama seperti Claude Code, OpenClaw, OpenCode, dan CodeBuddy, dengan peningkatan performa dalam tugas-tugas kode, tugas-tugas pembuatan dokumen, dan lainnya.
Akses API
Saat ini, DeepSeek API telah meluncurkan V4-Pro dan V4-Flash secara simultan, mendukung antarmuka OpenAI ChatCompletions dan antarmuka Anthropic. Saat mengakses model baru, base_url tetap tidak berubah, dan parameter model perlu diubah ke deepseek-v4-pro atau deepseek-v4-flash.
V4-Pro dan V4-Flash memiliki panjang konteks maksimum 1M, keduanya mendukung mode non-thinking dan mode thinking, di mana mode thinking mendukung parameter reasoning_effort untuk mengatur intensitas berpikir (high/max). Untuk skenario Agent yang kompleks, direkomendasikan untuk menggunakan mode thinking dan mengatur intensitas ke max.
Harap perhatikan: Dua nama model antarmuka API lama deepseek-chat dan deepseek-reasoner akan dihentikan dalam tiga bulan (2026-07-24). Pada tahap saat ini, kedua nama model ini masing-masing menunjuk ke mode non-thinking dan mode thinking dari deepseek-v4-flash.
Bobot Open-Source dan Deployment Lokal
Tautan open-source model DeepSeek-V4:
- Hugging Face: https://huggingface.co/collections/deepseek-ai/deepseek-v4
- ModelScope: https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
Laporan teknis DeepSeek-V4: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf