DeepSeek V4 Model Chi Tiết: Quy Mô Tham Số, Khả Năng và Hiệu Suất

DeepSeek V4 Model đẩy ngữ cảnh dài lên mức triệu token và giới thiệu khả năng đa phương thức gốc cùng kiến trúc hoàn toàn mới. Bài viết này cung cấp giải thích ngắn gọn về quy mô tham số, khả năng và hiệu suất của DeepSeek V4.

👉 Dùng ngay Deepseek4

DeepSeek V4 Model Chi Tiết

1. Tham Số và Kiến Trúc

  • Quy mô: Phiên bản đầy đủ V4 khoảng 1 nghìn tỷ tham số MoE, với khoảng 32 tỷ tham số được kích hoạt; V4 Lite khoảng 200B, đã được phát hành.
  • Ngữ cảnh: Nâng từ 128K lên 1 triệu tokens, giúp xử lý toàn bộ cơ sở dữ liệu, tài liệu dài và Agent đa lượt hội thoại khả dụng hơn.
  • Kiến trúc: Engram (bộ nhớ có điều kiện), DSA (chú ý thưa thớt), mHC (siêu kết nối cải tiến), giúp kiểm soát chi phí và tăng độ ổn định trong ngữ cảnh dài.

2. Điểm Nổi Bật về Khả Năng

  • Đa phương thức gốc: Mô hình hóa thống nhất văn bản, hình ảnh, video, hỗ trợ tạo ảnh từ văn bản, tạo video từ văn bản và suy luận đa phương thức.
  • Mã nguồn: Điểm SWE-bench Verified rò rỉ khoảng 83.7%, có tư duy tổng thể về kỹ thuật.
  • Chi phí: Chi phí suy luận có lợi thế so với đối thủ, thuận lợi cho Agent hoạt động 7×24 và ứng dụng quy mô lớn.

3. V4 Lite và Phiên Bản Đầy Đủ

Hiện tại V4 Lite đã được phát hành; phiên bản đầy đủ dự kiến có số lượng tham số và khả năng cao hơn, chi tiết cụ thể theo thông báo chính thức. Lộ trình của DeepSeek V4 Model là ngữ cảnh dài + đa phương thức gốc + hiệu quả chi phí.

Muốn trải nghiệm trực tiếp DeepSeek V4, hãy nhấn vào nút bên dưới.

👉 Dùng ngay Deepseek4