Google DeepMind представила Gemini 3.5 Flash: высокая скорость генерации и рост эксплуатационных расходов в 5,5 раза

Новость

Редактор новостной ленты

5/20/2026, 12:29:16 PM

Google DeepMind представила Gemini 3.5 Flash: высокая скорость генерации и рост эксплуатационных расходов в 5,5 раза

Google DeepMind представила модель Gemini 3.5 Flash: по данным анализа Artificial Analysis, получившего ранний доступ, она выдает более 280 выходных токенов в секунду и считается самой быстрой в своём классе, но по итогам бенчмарков эксплуатационные расходы выросли в 5,5 раза по сравнению с предшественницей Gemini 3 Flash. Это сочетание высокой пропускной способности и удорожания важно для компаний и разработчиков, которые оценивают не только скорость, но и итоговую стоимость работы модели в реальных сценариях.

Технические параметры изменились частично: контекстное окно осталось на уровне одного миллиона токенов, но базовые тарифы за токены выросли — с $0.50 до $1.50 за миллион входных токенов и с $3.00 до $9.00 за миллион выходных. По номинальной цене за токен Gemini 3.5 Flash всё ещё дешевле, чем Gemini 3.1 Pro ($2.00 за входные и $12.00 за выходные токены), однако это преимущество оказывается частично номинальным на практике.

Artificial Analysis отмечает, что дополнительная стоимость проявляется в повышенном потреблении токенов: в агентных сценариях Gemini 3.5 Flash требует больше шагов взаимодействия и использует значительно больше токенов, поэтому суммарные расходы на агентные тесты оказались на 75% выше, чем у более дорогостоящей на бумаге Gemini 3.1 Pro. Другими словами, снижение цены за отдельный токен не компенсирует прирост потребления в реальных рабочих нагрузках.

По качеству в бенчмарках модель продемонстрировала рост: индекс Artificial Analysis AI Index у Gemini 3.5 Flash равен 55 баллам — на 9 пунктов выше Gemini 3 Flash; это выводит её впереди Grok 4.3 (53) и Claude Sonnet 4.6 (52). На метрике AA Omniscience модель улучшилась на 11 пунктов, а частота галлюцинаций снизилась до 61% — на 31 процентный пункт меньше, чем у предшественницы, но заметно выше лидеров, где показатель близок к ~25%.

Gemini 3.5 Flash показывает наибольшие приросты в агентных и мультимодальных задачах, однако заметно уступает конкурентам в задачах программирования: в этой области она отстаёт от моделей вроде GPT‑5.5 и Claude Opus 4.7. Это подчёркивает, что улучшения в одних классах задач могут сопровождаться компромиссами в других.

Тенденция с ростом расходов не уникальна для Google: Anthropic при запуске Opus 4.7 зафиксировал рост стоимости примерно на 30 — 40% из‑за увеличения потребления токенов, а у OpenAI переход на GPT‑5.5 привёл к росту затрат на 50 — 90% по сравнению с версией 5.4 (в том случае снизилось потребление токенов, но выросли базовые цены). Для разработчиков и компаний ключевым показателем становится не только цена за токен, но и общая эффективность модели в реальных рабочих нагрузках; конечное влияние повышения цен будет зависеть от конкретных приложений и длительности использования.

Источники

The Decoder AI · 5/20/2026

Ответы (0)

Пока нет ответов в этой теме.