Meta переводит MTIA на модульную архитектуру для масштабирования ИИ-чипов

Таймлайн

Для обеспечения экономически эффективной работы генеративных нейросетей в глобальном масштабе Meta перешла на итеративную модульную архитектуру разработки аппаратного обеспечения.

Елена Воронцова

Редактор новостной ленты

4/24/2026, 4:02:48 PM

Meta переводит MTIA на модульную архитектуру для масштабирования ИИ-чипов

Каждый день миллиарды пользователей на платформах корпорации Meta взаимодействуют с технологиями искусственного интеллекта, получая персонализированные рекомендации и используя интеллектуальных помощников. Обслуживание широкого спектра моделей в глобальном масштабе при поддержании минимально возможных затрат является одной из самых сложных инфраструктурных задач в современной технологической индустрии. В ответ на этот вызов компания определяет новый путь развития, создавая гибкие аппаратные решения, которые непрерывно улучшаются по мере изменения потребностей. Оставаясь приверженной использованию разнообразного портфеля микропроцессоров и лучших доступных на рынке решений как внутренней, так и внешней разработки, Meta делает особую ставку на собственную линейку ускорителей.

Главной системной проблемой современного рынка микроэлектроники является то, что модели искусственного интеллекта эволюционируют значительно быстрее, чем традиционные циклы разработки аппаратного обеспечения могут предвидеть. Обычно проектирование чипов основывается на прогнозируемых рабочих нагрузках, однако к моменту запуска оборудования в серийное производство, что зачастую занимает около двух лет, эти нагрузки могут существенно измениться. Чтобы не полагаться на долгосрочные ставки и не ждать длительное время, инженеры Meta осознанно выбрали итеративный подход к разработке.

Исторический фундамент для этого ускорения был заложен первыми двумя поколениями чипов, подробности о которых были опубликованы в исследовательских статьях на конференциях ISCA’23 и ISCA’25. Эти решения, изначально известные как MTIA 1 и MTIA 2i, а теперь классифицируемые как MTIA 100 и MTIA 200, были развернуты в производственной среде в количестве сотен тысяч единиц. На этой базе было запущено множество внутренних производственных моделей, а сами чипы прошли успешное тестирование с использованием больших языковых моделей, таких как Llama. После внедрения первых версий компания форсировала разработку сразу четырех последующих поколений: MTIA 300, 400, 450 и 500.

Экономически эффективной основой для этого расширения стала архитектура MTIA 300, изначально оптимизированная для моделей ранжирования и рекомендаций, которые доминировали в системах Meta до массового распространения генеративного искусственного интеллекта. В настоящее время этот чип находится в производстве для обучения рекомендательных систем. Отличительными особенностями этой версии стали встроенные сетевые чиплеты, выделенные механизмы обмена сообщениями для разгрузки коммуникационных процессов и вычисления вблизи памяти. Аппаратная конфигурация включает один вычислительный чиплет, два сетевых чиплета и несколько стеков многослойной высокоскоростной памяти.

По мере того как спрос на генеративный искусственный интеллект стремительно возрастал, базовая архитектура трансформировалась в модель MTIA 400. Это решение было адаптировано для лучшей поддержки генеративных сетей, при этом полностью сохранив возможности эффективной работы с традиционными нагрузками ранжирования. Оснащенный доменом масштабирования из семидесяти двух ускорителей, чип обеспечивает высокую производительность, которая может успешно конкурировать с ведущими коммерческими продуктами на рынке. На данный момент инженеры уже завершили лабораторное тестирование данной версии и находятся на пути к ее физическому развертыванию в глобальных центрах обработки данных.

Предвидя колоссальный рост потребности в инференсе генеративных нейросетей, команда разработчиков осуществила переход к версии MTIA 450, внедрив в нее узконаправленные оптимизации. Поскольку пропускная способность памяти является наиболее важным фактором, влияющим на скорость работы таких моделей, инженеры удвоили этот показатель по сравнению с четырехсотой серией, сделав его значительно выше, чем у существующих передовых коммерческих аналогов. В дополнение к этому, в архитектуру были интегрированы типы данных низкой точности, специально разработанные для рабочих нагрузок инференса. Массовое развертывание данных ускорителей официально запланировано на начало 2027 года.

Продолжая фокусироваться на оптимизации процессов вывода генеративного искусственного интеллекта, Meta анонсировала выпуск финальной версии из актуального плана — чипа MTIA 500. В этой конфигурации пропускная способность высокоскоростной памяти была увеличена еще на пятьдесят процентов по сравнению с предшествующей моделью, а также были внедрены дополнительные инновации в обработке данных. Массовое развертывание этого кристалла также намечено на 2027 год. Оценивая эволюцию от трехсотой серии к пятисотой, можно констатировать беспрецедентный скачок: пропускная способность памяти возрастает в четыре с половиной раза, а вычислительная мощность в операциях с плавающей запятой увеличивается в двадцать пять раз, переходя от формата MX8 к формату MX4.

Источники

Meta AI Blog

Ответы (0)

Пока нет ответов в этой теме.