TPU восьмого поколения разработаны с учетом системного со — дизайна для ускорения полного жизненного цикла ИИ. Модель TPU 8t предназначена для обучения передовых моделей, а TPU 8i — для крупномасштабного инференса и обучения с подкреплением.
22 апреля 2026 года Google Cloud анонсировала восьмое поколение своих тензорных процессоров (TPU), включая модели TPU 8t и TPU 8i. Эти новые ускорители, представленные Дивакаром Гуптой и Сабастианом Мугазамби, разработаны с учетом системного со — дизайна для оптимизации полного жизненного цикла искусственного интеллекта, отвечая на растущие требования к производительности и эффективности в сфере ИИ.
Модель TPU 8t специально оптимизирована для масштабного предварительного обучения и работы с большим объемом встраиваний, в то время как TPU 8i предназначена для крупномасштабного инференса и задач обучения с подкреплением. Обе системы являются ключевыми компонентами архитектуры AI Hypercomputer от Google Cloud, объединяющей аппаратное обеспечение, программное обеспечение и сетевые технологии. Важной особенностью стало также включение Arm-процессоров Axion, что позволяет устранить узкие места хоста, возникающие из-за задержек при подготовке данных.
TPU 8t включает ряд значительных технических усовершенствований. Среди них — SparseCore, специализированный ускоритель для эффективной обработки нерегулярных шаблонов доступа к памяти при поиске встраиваний. Архитектура обеспечивает перекрытие VPU/MXU для максимальной утилизации операций с плавающей запятой (FLOPs) и минимизации времени векторных операций. Внедрена поддержка Native FP4, которая удваивает пропускную способность MXU, сохраняя при этом точность для больших моделей и снижая энергопотребление за счет уменьшения объема перемещаемых данных. Одна суперподсистема TPU 8t масштабируется до 9600 чипов с использованием инновационной 3D-топологии сети «тор».
Появление таких моделей, как массивные архитектуры Mixture — of-Experts (MoE) и модели, ориентированные на рассуждения, требует эволюции аппаратного обеспечения. Современные ускорители должны не просто увеличивать количество операций с плавающей запятой, но и отвечать специфическим операционным интенсивностям новейших рабочих нагрузок. Рост агентного ИИ, способного обрабатывать длинные контекстные окна и сложную последовательную логику, лишь подчеркивает эту потребность в специализированных решениях.
Новые TPU от Google Cloud призваны решать задачи, связанные с разработкой «мировых моделей», которые симулируют будущие сценарии и обучаются посредством «воображения». Они позволяют эффективно обучать и обслуживать такие передовые системы, как Genie 3 от Google DeepMind, давая миллионам агентов возможность оттачивать свои навыки рассуждения в разнообразных симулированных средах. Принципы масштабируемости, надежности и эффективности остаются центральными в философии дизайна Google TPU.
Источники
Ответы (0)
Пока нет ответов в этой теме.