Постоянное снижение цен на DeepSeek-V4-Pro API

22 мая 2026 года DeepSeek официально объявил, что цена API его флагманской модели DeepSeek-V4-Pro будет навсегда снижена до 1/4 от первоначальной цены после окончания ограниченной скидки 75% 31 мая.
Это не краткосрочная акция — это подлинный стратегический сдвиг в ценообразовании.
1. Сколько это стоит после снижения цены?
Давайте посмотрим на основные цифры:
| Статья тарификации | Исходная цена (юань/млн токенов) | Постоянная цена (юань/млн токенов) | Снижение |
|---|---|---|---|
| Ввод (попадание в кэш) | 0,1 | 0,025 | 75% |
| Ввод (промах кэша) | 12 | 3 | 75% |
| Вывод | 24 | 6 | 75% |
Все три уровня снижены до 1/4 от первоначальной цены. Цена ввода при попадании в кэш упала всего до 0,025 юаня/млн токенов — практически ничтожная сумма.
Сравнение между моделями делает это ещё более наглядным:
| Модель | Цена ввода | Цена вывода |
|---|---|---|
| DeepSeek-V4-Pro | 3 юаня | 6 юаней |
| GPT-5.5 | ~120 юаней | ~240 юаней |
| Claude Opus 4 | ~105 юаней | ~210 юаней |
Цены на ввод и вывод DeepSeek-V4-Pro составляют лишь 2%-3% от цен GPT-5.5 и аналогичных конкурентов — это даже не в одной лиге.
2. Почему это может быть так дёшево?
Такой уровень снижения цен — это не демпинг. Он подкреплён ясными техническими основаниями.
1. Собственная архитектура внимания
DeepSeek использует архитектуру MLA (Multi-Head Latent Attention) начиная с V2, которая радикально сжимает объём памяти механизма внимания. V4 дополнительно оптимизирует это, снижая потребление памяти при одном выводе примерно на 60% по сравнению с моделями аналогичного масштаба.
2. Оптимизация под чипы Huawei Ascend
Команда DeepSeek провела глубокую операторную адаптацию для Huawei Ascend 910B, максимизируя использование пропускной способности связи и стабильность смешанной точности обучения. Отечественные чипы стоят значительно дешевле NVIDIA A100/H100, при этом разрыв в фактической эффективности вывода продолжает сокращаться.
3. Система Engram: CPU как склад, GPU как мастерская
Система Engram V4 хранит 80% статических знаний в CPU DRAM, оставляя для GPU только основные задачи вывода. Эта архитектура «горяче-холодного разделения» кратно повышает утилизацию памяти GPU и напрямую снижает стоимость оборудования на один вывод.
3. Что это значит для разработчиков?
Сценарии с высоким потреблением токенов наконец стали доступными
Генерация кода, анализ длинных документов, пакетная обработка данных — у этих сценариев есть одно общее: массовое потребление токенов. Для задачи среднего масштаба по автодополнению кода один вызов может потребовать 50 000–100 000 токенов. На GPT-5.5 это стоит несколько юаней за вызов; на DeepSeek-V4-Pro — всего несколько фэней.
Этот разрыв в цене напрямую влияет на два решения:
- Команды, которые ранее отказывались от AI-помощи из-за стоимости, теперь могут пересмотреть своё решение
- Команды, уже использующие другие API, сталкиваются с почти нулевой стоимостью миграции (совместимость с OpenAI SDK — просто смените endpoint)
Малые команды и индивидуальные разработчики выигрывают больше всего
Крупные технологические компании имеют бюджет для запуска моделей с сотнями миллиардов параметров. У малых команд его нет. DeepSeek-V4-Pro снижает стоимость топовых моделей до уровня, доступного каждому, что является существенной победой для независимых разработчиков, стартапов и студентов.
4. Финансирование в 70 миллиардов юаней и направление AGI
Наряду с объявлением о снижении цен DeepSeek сообщил о текущем раунде финансирования в 70 миллиардов юаней.
Позиция основателя Ляна Вэньфэна ясна: технологические прорывы AGI имеют приоритет над краткосрочной коммерциализацией. Это означает, что DeepSeek не будет значительно повышать цены из-за финансового давления в ближайшей перспективе — вместо этого продолжит использовать низкие цены для расширения своей экосистемы разработчиков.
Эта логика похожа на решение Meta об открытии исходного кода LLaMA — сначала создайте ров экосистемы, а потом говорите о коммерциализации. Разница в том, что DeepSeek идёт по двойному пути «ультрадешёвый API + открытые веса», что ещё более выгодно для разработчиков.
5. Как начать? Запуск за одну минуту
Если вы ещё не пробовали DeepSeek-V4-Pro, интеграция проста:
Метод API: Совместим с OpenAI SDK — просто измените base_url и api_key:
from openai import OpenAI
client = OpenAI(
api_key="ваш-api-ключ",
base_url="https://api.deepseek.com"
)
response = client.chat.completions.create(
model="deepseek-v4-pro",
messages=[{"role": "user", "content": "Привет"}]
)
print(response.choices[0].message.content)
Онлайн-опыт: Не хотите возиться с настройкой API? Используйте напрямую онлайн:
Заключение
Постоянное снижение цен на DeepSeek-V4-Pro фундаментально переопределяет базовую планку цен для API больших моделей.
Когда ввод при попадании в кэш стоит всего 0,025 юаня/млн токенов, а вывод — всего 6 юаней/млн токенов, многие сценарии AI-приложений, которые ранее «не имели финансового смысла», внезапно становятся жизнеспособными. Это не маркетинговая уловка — это подлинное снижение затрат.
Новые цены вступают в силу после окончания акции 31 мая. Если вы работаете над проектом, предполагающим значительное потребление токенов, сейчас самое время начать тестирование DeepSeek-V4-Pro.