Представлены Qwen 3.7‑Max, сервер Panjiu AL128 и чип Zhenwu M890 для масштабирования автономных агентов

Новость

Редактор общего направления

6/1/2026, 1:27:14 AM

Представлены Qwen 3.7‑Max, сервер Panjiu AL128 и чип Zhenwu M890 для масштабирования автономных агентов

20 мая 2025 года на саммите в Ханчжоу компания объявила крупное обновление AI‑стека, включающее новую версию базовой модели Qwen 3.7‑Max, сервер Panjiu AL128 Supernode и AI‑чип Zhenwu M890 от T‑Head. Эти объявления нацелены на масштабирование «agentic» — автономных агентов, — что важно для разработчиков и предприятий, которым требуются долгие сценарии работы, высокая пропускная способность и контролируемое поведение агентов.

Qwen 3.7‑Max позиционируется как универсальная основа для agentic‑сценариев: от генерации и отладки кода (от быстрой фронтенд‑прототипировки до сложной многомодульной разработки) до автоматизации офисных задач и выполнения многозвенных рабочих процессов. По заявлению компании, модель поддерживает продолжительную автономную работу до 35 часов и способна совершать более 1 000 вызовов инструментов без деградации производительности. Qwen 3.7‑Max оптимизирована под OpenClaw, Hermes Agent, Claude Code, Qwen Paw и Qoder и вскоре будет доступна через Model Studio для глобальных разработчиков.

Для масштабного инференса и крупномасштабного обучения представлен сервер Panjiu AL128 Supernode, который объединяет 128 AI‑ускорителей в одном шкафу. Платформа использует процессор Zhenwu M890 и сетевой чип ICN Switch 1.0; по данным компании, конфигурация обеспечивает пропускную способность одного шкафа на уровне петабайтов в секунду (PB/s). Такая архитектура рассчитана на обработку больших одновременных запросов от агентов и уже доступна в Model Studio для китайского рынка (Bailian).

T‑Head анонсировала AI‑чип Zhenwu M890 для обучения и инференса: он в три раза производительнее предшественника Zhenwu 810E, оснащён 144 ГБ GPU‑памяти и обеспечивает межчиповую пропускную способность 800 ГБ/с. Чип нативно поддерживает форматы с плавающей точкой от FP32 до низкой FP4, что важно для балансирования точности и эффективности на современных моделях. Платформа модельных сервисов получила сопутствующие обновления: постоянное улучшение производительности моделей, внедрение механизма Agentic RL с подкреплением, который использует обратную связь от исполнения агентов для итеративной доработки их поведения, а также встроенные средства управления безопасностью. Эти инструменты предназначены для контроля автономных агентов и соблюдения заданных ограничений при работе в продакшне.

В совокупности объявленные модель, сервер и чип дают разработчикам и предприятиям инфраструктуру и ПО для вывода долгих автономных сценариев и сложных многозадачных рабочих потоков в продакшн: мощные модели, плотный серверный парк с пропускной способностью в PB/s и специализированные ускорители сокращают задержки и упрощают масштабирование инференса и распределённого обучения. Комбинация Agentic RL и встроенной безопасности предоставляет путь для итерации поведения агентов в рабочих средах при контролируемом выполнении задач.

Источники

Alibaba Cloud Blog · 5/20/2026

Ответы (0)

Пока нет ответов в этой теме.