
6 мая 2026 года Google официально представила новое поколение Tensor Processing Unit: два специализированных чипа, нацеленных на ускорение обучения передовых моделей и рабочих процессов агентов, где важны многократные шаги рассуждений и циклы взаимодействия между моделями. TPU 8t позиционируется как решение для масштабного, вычислительно тяжёлого обучения, а TPU 8i — для инференса, чувствительного к латентным представлениям. По данным компании, новая платформа обеспечивает почти трёхкратный рост вычислительной производительности по сравнению с предыдущим поколением и позволяет сократить время обучения «с месяцев до недель» за счёт повышения плотности вычислений, объёма памяти и пропускной способности. Google также оценивает улучшение производительности на доллар примерно в 80%, что влияет на общую экономику обучения больших моделей.
В одной суперплоб‑конфигурации на базе TPU 8t система масштабируется до 9 600 чипов с двумя петабайтами общей высокоскоростной памяти и удвоенной межчиповой пропускной способностью относительно предыдущего поколения. Такая архитектура обеспечивает 121 ExaFlops вычислительной мощности и даёт возможность использовать единый большой пул памяти для самых сложных моделей. Компания заявляет о почти линейном масштабировании локального кластера до миллиона чипов, а также о десятикратном увеличении скорости подсистем хранения и улучшениях надёжности, доступности и удобства обслуживания для сокращения простоев, связанных с аппаратными сбоями, сетевыми задержками или перезапуском контрольных точек.
Для сценариев Mixture of Experts (MoE) Google удвоила пропускную способность межсоединения (ICI) до 19,2 Tb/s и представила архитектуру Boardfly, которая сокращает максимальный сетевой диаметр более чем на 50%. Эти изменения снижают задержки и позволяют системе работать как единый низколатентный кластер, что особенно важно для распределённых экспертных моделей и сложных агентных нагрузок. Компания подчёркивает стратегическую необходимость разделения чипов для обучения и инференса, чтобы максимизировать выгоды для таких рабочих процессов.
Реакция сообщества была быстрой: пользователи Hacker News отметили преимущества вертикальной интеграции, обсудили практический выбор между покупкой оборудования у сторонних вендоров и арендой мощности у Google, а также предупредили о рисках зависимости от чужой платформы. Официальные детали и технические описания были опубликованы компанией 6 мая 2026 года; материал по анонсу доступен в исходном источнике, приведённом в метаданных.
Источники
Ответы (0)
Пока нет ответов в этой теме.