Deepseek объявила о бессрочной 75% скидке на модель V4 Pro: 1 млн входных токенов стоит $0.435, 1 млн выходных — $0.87; при кэше вход падает до $0.003625. По сравнению с заявленными тарифами GPT‑5.5 это примерно в 11 — 34× дешевле.
Deepseek подтвердила в сообщении на X, что промо‑скидка 75% на флагманскую модель V4 Pro, ранее действовавшую до 31 мая 2026 года, становится постоянной; компания внесла новые цены в публичный прайс. Это напрямую снижает стоимость расчётов для приложений и агентов с высокой интенсивностью токенов и может изменить экономику развертываний для разработчиков, использующих крупные контексты.
По новым тарифам Deepseek V4‑Pro стоит $0.435 за 1 млн входных токенов без кэша и $0.87 за 1 млн выходных токенов; при попадании в кэш цена входа для V4‑Pro опускается до $0.003625 за 1 млн. Модель V4‑Flash указана по $0.14 за миллион входных, $0.0028 при кэш‑попадании и $0.28 за миллион выходных. Оба варианта поддерживают контекст до 1 млн токенов и до 384 000 выходных токенов; платформа совместима с форматами API OpenAI и Anthropic.
Deepseek сравнивает свои цены с конкурентами: в публичных примерах GPT‑5.5 показан по $5 за 1 млн входных и $30 за 1 млн выходных, а Opus 4.7 — по $5 и $25 соответственно. Исходя из этих цифр, V4‑Pro оказывается примерно в 11.5× дешевле GPT‑5.5 по стандартному входу и около 34.5× дешевле по выходу; при тарифах GPT‑5.5 для длинного контекста (>272K) разрыв по входу увеличивается до примерно 23×, а по выходу — до ~51.7×.
Однако цена не равна производительности: Deepseek отмечает, что V4‑Pro и V4‑Flash уступают фронтирным моделям GPT‑5.5 и Opus 4.7 по «сырой» мощности. Фактические расходы зависят от того, сколько токенов потребляет модель на задачу и как часто срабатывает кэш. В материале приводятся примеры: Gemini Flash 3.5 теоретически дешевле по тарифу, но может сжигать больше токенов; Opus 4.7 также показывает рост расхода токенов по сравнению с предшественником; GPT‑5.5, наоборот, тратит меньше токенов на те же задачи, хотя прошлые обновления делали её итоговую стоимость на 30 — 90% выше.
Практический вывод для разработчиков и компаний прост: при высоком токен‑интенсивном использовании агентов заявленная экономия Deepseek может значительно снизить общую стоимость владения (TCO) и создать ценовое давление на западных поставщиков. Одновременно выбор модели требует тестов на реальных задачах с учётом кэш‑попаданий, фактического расхода токенов и ограничений по выводу; совместимость с OpenAI/Anthropic API облегчает миграцию прототипов и агентов между платформами.
Источники
Ответы (0)
Пока нет ответов в этой теме.