
На конференции Cloud Next 2026 Google представил два ключевых обновления для Google Kubernetes Engine, направленные на поддержку мультииагентных AI‑воркфлоу и масштабных вычислений: GKE Agent Sandbox — механизм ядровой изоляции для исполнения небезопасного агентного кода — и GKE hypercluster, дающий единую GKE control plane для управления огромным числом ускорителей. Это важно для компаний, которые хотят запускать агентные и генеративные нагрузки безопасно и в масштабах гипермаштабной инфраструктуры.
GKE Agent Sandbox реализует изоляцию на уровне ядра с использованием gVisor — той же технологии песочницы, которую Google применяет для Gemini. Google заявляет о пропускной способности до 300 песочниц в секунду при задержках ниже секунды и о преимуществе по соотношению цена/производительность до 30% на Axion по сравнению с другими гипермасштабными облаками. Sandbox представлен как проект SIG Apps Kubernetes (анонсирован на KubeCon NA 2025) и вводит три примитива: Sandbox для рабочей нагрузки, SandboxTemplate как шаблон безопасности и SandboxClaim для транзакционного запроса исполнения.
GKE hypercluster, объявленный в режиме private GA, решает проблему фрагментации инфраструктуры: единая, соответствующая стандартам GKE control plane может управлять до миллиона чипов, распределённых по 256 000 узлов и нескольким регионам. Безопасность в архитектуре hypercluster обеспечивается через Titanium Intelligence Enclave — аппаратно‑аттестованную модель с «no‑admin‑access», где коммерческие веса моделей и подсказки остаются криптографически запечатанными от администраторов платформы. Рынок песочниц для агентного кода ужесточается: Cloudflare выпустила Sandboxes GA с контейнерной изоляцией и V8 isolate‑основанные Dynamic Workers, а E2B использует Firecracker microVM. По наблюдению Alex Gkiouros, на текущий момент GKE Agent Sandbox — единственное «нативное» решение песочницы среди трёх крупных гипермасштабных провайдеров, что делает его отличительной чертой Google в этом сегменте.
Google подчёркивает промышленное применение: по словам Drew Bradstock и Gari Singh, GKE уже обслуживает AI‑нагрузки для всех 50 крупнейших клиентов платформы, включая ведущих разработчиков фронтирных моделей. В продакшене Agent Sandbox уже используется, например, платформой Lovable, которая поддерживает более 200 000 новых AI‑проектов в день; сооснователь Fabian Hedin отмечает, что песочница позволяет масштабироваться до сотен безопасных окружений в секунду. радиус поражения и управление изменениями при контроле миллиона чипов остаются серьёзными вопросами, что делает этап private GA оправданным.
Кроме песочницы и hypercluster, Google объявил и улучшения для инференса в GKE: две отдельные апдейты, одно из которых — Predictive Latency Boost в GKE Inference Gateway — использует ML‑маршрутизацию для снижения латентности обработки запросов. Эти изменения отражают стратегию Google по сокращению задержек и повышению эффективности при работе с генеративными и агентными нагрузками.
Источники
Ответы (0)
Пока нет ответов в этой теме.