Aivizor
Aivizor
EstilosCreacionesComunidad
Atrás
  1. Comunidad
  2. /
  3. Other AI

Alibaba lanza Qwen3.7‑Plus en Bailian, un agente multimodal con visión y capacidades de programación autónoma

News
L
Lucía Valcárcel

6/2/2026, 9:26:56 AM

Alibaba lanza Qwen3.7‑Plus en Bailian, un agente multimodal con visión y capacidades de programación autónoma

Qwen3.7‑Plus, la versión multimodal del conjunto Qwen 3.7, ya está disponible en Bailian (Model Studio) de Alibaba Cloud y ofrece visión, procesamiento de video y funciones agenticas accesibles vía API.

Alibaba ha puesto a disposición Qwen3.7‑Plus en Bailian — la consola internacional conocida como Model Studio—, habilitando acceso por API para desarrolladores externos. La publicación de Plus sigue al lanzamiento del conjunto Qwen 3.7 en mayo y marca la llegada de un agente multimodal diseñado para comprender información visual y actuar de forma iterativa en flujos de trabajo complejos, lo que interesa a equipos que automatizan tareas con componentes visuales y de código.

Qwen3.7‑Plus es un modelo de lenguaje a gran escala multimodal que procesa texto, imágenes y video con énfasis en comprensión visual; no está orientado a generar imágenes. Su contraparte textual se denomina Qwen3.7‑Max. Alibaba detalla cinco capacidades clave integradas en la versión Plus: razonamiento profundo; auto‑programación (capacidad de escribir y revisar su propio código); invocación de herramientas (llamadas a funciones o APIs externas); verificación y pruebas (ejecución y validación de salidas); e iteración autónoma (repetición del ciclo hasta completar la tarea).

En una previa pública, Qwen3.7‑Plus se posicionó en el puesto 16 del ranking Vision Arena, un tablero neutral operado por LM Arena que evalúa modelos mediante enfrentamientos a ciegas y votación de usuarios; ese resultado situó al laboratorio de Alibaba como el quinto en visión dentro de ese listado. Por su parte, Qwen3.7‑Max obtuvo una puntuación de 56.6 en el Artificial Analysis Intelligence Index, la cifra más alta entre modelos chinos en el momento del lanzamiento mencionado.

Bailian incorpora además un mecanismo de Agentic RL que aprovecha la retroalimentación de ejecuciones en el mundo real para refinar la precisión del agente con el tiempo. La plataforma añade guardarraíles de seguridad integrados que limitan operaciones autónomas dentro de parámetros predefinidos, pensados para controlar acciones como la ejecución de comandos, la edición de archivos o las llamadas a APIs externas desde el agente.

Para desarrolladores y equipos de producto, Qwen3.7‑Plus permite construir agentes capaces no solo de responder consultas, sino de planificar, actuar y validar resultados en flujos de trabajo largos. Casos de uso citados incluyen OCR a escala, análisis de cuadros de video, lectura de gráficos y pipelines que requieren escribir y probar código; el acceso por API en Bailian facilita la integración de esas capacidades en aplicaciones y automatizaciones existentes.

La combinación de comprensión visual y funciones agenticas señala un enfoque hacia modelos que actúan de forma iterativa y autónoma en tareas compuestas. Las capacidades de verificación y los guardarraíles de Bailian son detalles relevantes para equipos que consideren desplegar agentes con ejecución en el mundo real; la generación de imágenes y video, según la plataforma, sigue gestionándose en familias de modelos separadas.

Fuentes

  1. MarkTechPost AI · 6/2/2026
0
0
0

Respuestas (0)

Aún no hay respuestas en este tema.

9:41