Обновления Qwen и Model Studio дали разработчикам мультимодальные и видео‑возможности

Новость

Редактор аналитических материалов

5/15/2026, 8:09:43 AM

Обновления Qwen и Model Studio дали разработчикам мультимодальные и видео‑возможности

Серия апрельских обновлений из бюллетеня Big Data & AI Platform включает новые версии Qwen, улучшения генерации изображений и видео, а также корпоративную платформу Model Studio Enterprise.

В ежемесячном бюллетене Big Data & AI Platform за апрель 2026 года представлены крупные обновления для разработчиков и корпоративных пользователей: обновлённое семейство моделей Qwen, расширенные средства генерации изображений и видео, а также платформа Model Studio Enterprise для развёртывания больших моделей. Эти изменения открывают дополнительные возможности для создания мультимодальных агентов и интеграции AI‑функций в продакшен‑сервисы. Model Studio Enterprise описывается как enterprise‑grade large model service and application development platform — корпоративная платформа для обслуживания больших моделей и разработки приложений. Отдельно выделен Visual Model: инструмент, который поддерживает понимание изображений, генерацию изображений и генерацию видео, то есть объединяет анализ входного визуального контента и создание медиаконтента в единой среде.

Новая линейка Qwen получила несколько версий с разной направленностью. Qwen3.6-Plus позиционируется с пометкой «Towards Real World Agents — Native Multimodal, 1M Context, Agentic Coding», то есть ориентирована на реальные агентные сценарии с нативной мультимодальностью и контекстным объёмом до 1M. Qwen3-Max заявлен как SOTA‑вариант для более сложных интеллектуальных агентов, Qwen — Plus описан как сбалансированная модель для универсальных задач, также упомянута версия Qwen3-VL — Plus. Для мультимедийной генерации бюллетень называет стек, включающий Wan2.6 (image‑to‑video), который поддерживает генерацию длинных роликов до 15 секунд с интеллектуальной сегментацией сцен и структурированием повествования. Такое решение предназначено для автоматизации перехода от изображений к коротким сюжетным видео и может применяться в сценариях быстрого контента и прототипирования видеоповествований.

В аудиосфере отмечено Fun — ASR, система распознавания речи с поддержкой бесшовного переключения Chinese↔English и повышенной устойчивостью к шуму. Комбинация улучшенной мультимодальности, видеогенерации и устойчивой ASR создаёт набор инструментов для приложений, работающих со смешанными входами — текстом, изображением и звуком. В бюллетене подчёркнута ориентация обновлений на корпоративные и разработческие сценарии: сформулирована цель «empowering AI innovation for both enterprises and developers» через сочетание Qwen‑моделей, AI‑native приложений и сопутствующих решений. Для инженеров и команд разработки ключевые последствия понятны: контекстный объём 1M у Qwen3.6 и заявленные агентные способности расширяют возможности для сложных многошаговых агентов и кодирующих рабочих процессов; Wan2.

Model Studio Enterprise обещает инфраструктуру для запуска и интеграции таких моделей в продакшен‑приложения.

Источники

Alibaba Cloud Blog · 5/15/2026

Ответы (0)

Пока нет ответов в этой теме.