На конференции Google Cloud Next '26, состоявшейся 22 апреля 2026 года, Google Cloud анонсировала значительное расширение своего портфолио инфраструктуры для искусственного интеллекта. Эти нововведения, в первую очередь, направлены на поддержку так называемой "агентной эры" ИИ, где системы не просто отвечают на вопросы, но способны к рассуждениям и выполнению действий через цепочки специализированных агентов. Ключевым анонсом стало восьмое поколение тензорных процессоров (TPU), которое впервые включает два специализированных чипа, разработанных для оптимизации рабочих нагрузок и снижения затрат на энергопотребление. В частности, TPU 8t, предназначенный для высокопроизводительного обучения ИИ-моделей, предлагает почти втрое большую вычислительную мощность по сравнению с предыдущими поколениями.
Флагманский TPU 8t объединяет 9600 чипов в одном суперподе, обеспечивая впечатляющие 121 экзафлопс вычислительной мощности и 2 петабайта общей памяти. В то же время, TPU 8i был специально разработан для инференса и обучения с подкреплением, обеспечивая сверхнизкую задержку, критически важную для агентных рабочих процессов и моделей Mixture of Experts (MoE). Это достигается за счет утроенного объема SRAM на чипе (384 МБ) и увеличенного HBM (288 ГБ). Google позиционирует свою унифицированную платформу AI Hypercomputer, лежащую в основе Gemini и других ИИ-сервисов, как оптимальное решение для масштабирования этих сложных требований, подчеркивая неэффективность традиционных инфраструктур для агентного интеллекта.
Портфолио Google Cloud было расширено не только новыми TPU. В него также вошли инстансы A5X bare metal на базе NVIDIA Vera Rubin NVL72, а также виртуальные машины Axion N4A с кастомными Arm-процессорами от Google. Кроме того, представлены виртуальные машины четвертого поколения Google Compute Engine на базе процессоров Intel и AMD x86. Эти аппаратные инновации дополняются прорывной сетевой тканью Virgo Network, разработанной для ИИ-нагрузок, высокопроизводительной параллельной файловой системой Google Cloud Managed Lustre и Z4M VMs с локальным хранилищем SSD и RDMA, что обеспечивает комплексное улучшение всей экосистемы.
Для разработчиков Google Cloud реализовала нативную поддержку PyTorch для TPU, а также представила новые возможности Google Kubernetes Engine (GKE) для оркестровки рабочих нагрузок, специфичных для агентов. В совокупности, эти инновации призваны значительно ускорить разработку и обучение сложных моделей и агентных рабочих процессов, сокращая сроки с месяцев до недель.
Источники
Ответы (0)
Пока нет ответов в этой теме.