Alibaba представила Qwen3.7-Max — модель‑агент для длительных автономных задач

Новость

Редактор новостной ленты

5/23/2026, 12:11:26 PM

Alibaba представила Qwen3.7-Max — модель‑агент для длительных автономных задач

Команда Qwen выпустила Qwen3.7-Max, проприетарную модель‑агент, доступную только через Alibaba Cloud Model Studio API и рассчитанную на длительные автономные рабочие процессы с внешними инструментами и многофайловыми проектами.

Команда Qwen объявила о выпуске Qwen3.7-Max, модели, созданной специально для агентных сценариев и длительных автономных задач. Модель предлагается не как конечный пользовательский продукт, а через Alibaba Cloud Model Studio API и рассчитана на работу в средах с внешними инструментами и сложными многофайловыми проектами. Это делает её интересной для разработчиков и команд инфраструктуры, которым нужны инструменты для длительных итеративных циклов разработки низкоуровневого кода и оптимизации под специализированные ускорители.

В демонстрационном эксперименте Qwen3.7-Max занималась оптимизацией ядра внимания для open‑source инференсного ПО SGLang на облачных инстансах с ускорителями T‑Head‑ZW‑M890. Стартовав без измерительных данных, без документации по архитектуре и без примеров кода — опираясь только на эталонную реализацию на Triton — модель самостоятельно компилировала, проводила измерения, фиксировала ошибки и итеративно улучшала реализацию. В ходе работы было выполнено 432 теста ядра и осуществлено 1 158 вызовов внешних инструментов.

По итогам тестов разработчики сообщают средний прирост производительности примерно в 10× относительно эталонной реализации. В тех же условиях другие модели показали меньшую эффективность: GLM 5.1 — 7.3×, Kimi K2.6-5×, DeepSeek V4 Pro — 3.3×, а предшественник Qwen3.6-Plus — около 1.1×. На стандартизированном бенчмарке KernelBench L3 Qwen3.7-Max обеспечивает ускоренные ядра в 96% случаев, тогда как Anthropic Opus 4.6 достигает 98%. Авторы отмечают также стабильность результатов при работе с OpenClaw, Claude Code и Hermes.

Архитектурно Qwen3.7-Max использует разделение задачи на три независимых компонента: собственно задачу, окружение инструментов и валидатор результатов. Такие компоненты можно комбинировать при обучении, чтобы модель вырабатывала универсальные стратегии, а не специфические приёмы под одну конфигурацию. Команда также заявляет, что в модель встроены механизмы валидации, позволяющие выявлять нежелательное поведение и попытки «взломать» награды в процессе тренировки. По части интеграции Qwen3.7-Max совместима с интерфейсами, совместимыми с OpenAI и Anthropic, и может подлючаться к Claude Code, OpenClaw и Qwen Code. В отличие от более ранних релизов модель не распространяется как открытый проект — последний открытый флагман был Qwen3.5 (397B‑A17B, февраль 2026) — и доступна только через облачный API.

В материале также упомянута демонстрация управления четырёхногим роботом как дополнительный кейс применения, показывающая разнообразие задач, где модель‑агент может применяться вне оптимизации низкоуровневого кода.

Источники

The Decoder AI · 5/23/2026

Ответы (0)

Пока нет ответов в этой теме.