
Команда Qwen из Alibaba 20 мая 2026 года на саммите Alibaba Cloud официально представила модель Qwen3.7‑Max и объявила её доступность через API. Это релиз ориентирован на сложные многозадачные сценарии с «длинными цепочками» операций — например, итеративное изменение кода, отладка и автоматизация рабочих процессов — где требуется тысячи шагов рассуждений. До официального анонса две превью‑версии (Qwen3.7‑Max‑Preview и Qwen3.7‑Plus‑Preview) уже появились в табло LM Arena без сопутствующего пресс‑релиза и публикации официальных весов. Появление превью в бенчмарке указывает на раннюю проверку производительности, но поставляет ограниченные выводы без полного набора метрик и исходных весов.
В интерфейсе Qwen Chat реализован режим «Thinking»: модель сначала формирует внутреннюю цепочку рассуждений (planning/checking/correction), а затем выдаёт итоговый ответ. Alibaba позиционирует это как механизм улучшения надёжности выводов и планирования при выполнении длительных задач. При оценке поведения в режиме долгих рассуждений Qwen3.7‑Max сгенерировала примерно 97 млн токенов в ходе теста Intelligence Index против среднего по бенчмарку около 24 млн токенов, что свидетельствует о значительно большем внутреннем оверхеде на длинных цепочках. Такой внутренний «разговор» даёт преимущества при многозадачном планировании и рефакторинге кода, но одновременно увеличивает задержки для коротких и простых запросов.
В рейтинге Artificial Analysis Intelligence Index (v4.0) Qwen3.7‑Max набрала 56,6 балла и заняла пятое место, улучшився на 4,8 пункта по сравнению с Qwen3.6 Max Preview (51,8). Модель опередила Google Gemini 3.5 Flash (55,3) и уступила GPT‑5.5 (60,2), Claude Opus 4.7 (57,3) и Gemini 3.1 Pro Preview (57,2). Индекс агрегирует десять оценочных наборов, включая GDPval‑AA, Terminal‑Bench Hard и SciCode.
Qwen3.7‑Max получила окно контекста в 1 млн токенов вместо 256K у Qwen3.6, что позволяет поместить в один запрос репозиторий среднего размера или большой стек документов; при этом модель остаётся текст‑только. Независимое тестирование надёжности рассуждений при полностью заполненном контексте пока ограничено, а официальная ценовая политика для Qwen3.7 ещё не объявлена. Для сравнения, у Qwen3.6 Max Preview на Alibaba Cloud была цена $1.30/$7.80 за млн входных/выходных токенов.
Параллельно Qwen3.7‑Plus‑Preview позиционируется как сбалансированная высокопроизводительная версия с поддержкой зрения и мультимодальности и с фокусом на логическое выражение; её инструментальная цепочка будет открываться постепенно. В LM Arena превью‑версии показали разные позиции: Max‑Preview заняла #13 в текстовой арене (лаборатория Alibaba — #6 по тексту), а Plus‑Preview — #16 в видении (лаборатория Alibaba — #5).
Источники
Ответы (0)
Пока нет ответов в этой теме.