Google представила Gemini 3.5 Flash на I/O 20 мая 2026 года — ускоренный и более дешёвый LLM для агентных сценариев и кодинга

Новость

Редактор новостной ленты

5/20/2026, 7:57:59 AM

Google представила Gemini 3.5 Flash на I/O 20 мая 2026 года — ускоренный и более дешёвый LLM для агентных сценариев и кодинга

На конференции I/O 20 мая 2026 года Google представила Gemini 3.5 Flash — первую модель семейства 3.5, специально оптимизированную для agentic‑сценариев и задач по написанию кода. Компания позиционирует релиз как шаг вперёд для интеллектуальных агентов и систем, которым нужно многопроходное планирование, вызов внешних инструментов и продолжительное выполнение целей; это важно для разработчиков и предприятий, стремящихся масштабировать автоматизированные рабочие процессы.

В демонстрационных показателях Gemini 3.5 Flash показывает конкурентоспособные результаты по ряду бенчмарков: 76.2% по Terminal — Bench 2.1 (кодинг), 1656 Elo по GDPval — AA (agentic‑задачи), 83.6% по MCP Atlas (надёжность использования инструментов) и 84.2% по CharXiv Reasoning (мультимодальное понимание). Google также заявляет о четырёхкратном ускорении генерации выходных токенов и о частом сокращении стоимости задач более чем вдвое, что должно снизить затраты на длительные и ресурсоёмкие сессии.

Тарифы и ограничения озвучены подробно: входные токены — $1.50 за миллион, выходные токены — $9.00 за миллион, кэшированные входные — $0.15 за миллион. Окно контекста достигает 1 048 576 входных токенов, максимум выходных токенов — 65 536. Модель поддерживает текст, изображение, аудио и видео; знание ограничено январём 2026 года. По умолчанию включён режим «dynamic thinking», при котором модель автоматически выделяет больше вычислений на сложные задачи. Для упрощения развёртывания агентных рабочих процессов Google предлагает Managed Agents API: один вызов API разворачивает полноценного агента внутри изолированного Linux‑контейнера, где файлы и состояние сохраняются между обращениями. Это даёт готовую среду для многопроходных сессий, устраняя необходимость вручную управлять состоянием и окружением и позволяя агентам хранить промежуточные результаты и контекст между вызовами.

Вокруг модели сформирована экосистема Antigravity: Antigravity 2.0 — отдельное настольное приложение для оркестрации параллельных агентов, динамических субагентов и фоновых заданий; Antigravity CLI предназначен для работы в терминале, а SDK обеспечивает программный доступ к хранилищу агентов и настройке пользовательского поведения. Заявлены интеграции с AI Studio, Android и Firebase, а хостинг агентов возможен на выбранной инфраструктуре. Google также указала первые корпоративные развёртывания: Shopify использует параллельные субагенты для аналитики и прогнозов роста продавцов; Macquarie Bank пилотирует автоматизацию онбординга с обработкой документов объёмом 100+ страниц; Salesforce интегрирует модель в Agentforce; Ramp улучшает OCR для счетов; Xero автоматизирует многонедельные рабочие процессы по сбору данных поставщиков; Databricks применяет агентные сценарии для мониторинга в реальном времени.

Для разработчиков это обещает более низкую латентность и стоимость при долгих контекстных сессиях, но одновременно требует новых инженерных подходов к управлению выделением вычислений и валидации знаний после января 2026 года.

Источники

MarkTechPost AI · 5/20/2026

Ответы (0)

Пока нет ответов в этой теме.