На конференции Google Cloud Next '26 были представлены ключевые улучшения Google Kubernetes Engine (GKE), направленные на повышение производительности, эффективности, безопасности и масштабируемости для поддержки автономных и ИИ-приложений нового поколения.
22 апреля 2026 года на конференции Next '26 Google Cloud представил серию масштабных обновлений для Google Kubernetes Engine (GKE). Нововведения, анонсированные старшим директором по оркестрации и управлению продуктами Kubernetes Дрю Брэдстоком и менеджером по продуктам GKE Гари Сингхом, призваны обеспечить высочайшую производительность, эффективность, безопасность и масштабируемость. Они ориентированы на поддержку самых требовательных рабочих нагрузок, а также на развитие ИИ- и агентных приложений нового поколения.
Центральным элементом обновлений стал GKE Agent Sandbox — самая масштабируемая и низколатентная инфраструктура для агентов в индустрии. Она задействует изоляцию ядра gVisor, сходную с технологией Gemini, что позволяет безопасно запускать недоверенный код и полноценных агентов без ущерба для производительности. Agent Sandbox способен создавать до 300 изолированных сред в секунду с задержкой менее одной секунды, демонстрируя на 30% лучшую ценовую производительность при работе на Axion в сравнении с конкурирующими гиперскейлерами. Например, компания Lovable уже использует эту технологию для своих ИИ-генерируемых приложений.
Представленные улучшения подчеркивают возрастающую роль Kubernetes как операционной системы для эры искусственного интеллекта. GKE уже обслуживает ИИ-нагрузки для всех 50 крупнейших клиентов Google Cloud, включая ключевых разработчиков фундаментальных моделей. На фоне экспоненциального роста корпоративного ИИ, количество многоагентных рабочих процессов увеличилось на 327% всего за несколько месяцев. При этом 66% организаций активно используют Kubernetes для генеративных ИИ-приложений. В условиях экспоненциального роста фундаментальных ИИ-моделей и высокого спроса на ускорители Google Cloud представил GKE hypercluster в приватной публичной версии. Эта функция позволяет единой плоскости управления GKE, соответствующей стандарту Kubernetes, управлять до миллиона чипов, распределенных между 256 000 узлами в различных регионах Google Cloud. GKE hypercluster объединяет обширную распределенную инфраструктуру в единый резерв мощностей, значительно снижая операционные затраты.
Безопасность GKE hypercluster усилена благодаря Google Titanium Intelligence Enclave — механизму, обеспечивающему частные ИИ-вычисления с программно — укрепленной защитой и без административного доступа. Дополнительно, GKE получил улучшения производительности для вывода (inference) через GKE Inference Gateway и управление KV Cache. Внедрены нативные средства для оптимизации обучения с подкреплением (RL enhancers), а также расширена поддержка автомасштабирования на основе пользовательских метрик, выходящих за рамки использования CPU и памяти.
Источники
Ответы (0)
Пока нет ответов в этой теме.