En el Alibaba Cloud Summit en Hangzhou, Alibaba reveló Qwen 3.7‑Max, un modelo de lenguaje optimizado para operaciones sostenidas y flujos multi‑paso; el procesador Zhenwu M890, con triple rendimiento respecto al 810E;
En el Alibaba Cloud Summit en Hangzhou, celebrado el miércoles, la compañía presentó un paquete de productos y tecnologías orientadas a lo que denomina la era «agentic»: un nuevo modelo de lenguaje, un procesador de IA propio y una plataforma de nube rediseñada para soportar agentes autónomos y flujos de trabajo multi‑paso. Los anuncios buscan integrar modelo, hardware y servicios en la nube para cargas de trabajo que requieren ejecución sostenida y coordinación entre agentes.
El modelo Qwen 3.7‑Max fue presentado como la apuesta de la compañía para cargas agentic. Está diseñado para operar de forma continuada en tareas multi‑paso, gestionar proyectos de software con múltiples archivos y orquestar flujos de trabajo que implican varios agentes. Alibaba indicó que el modelo está optimizado para entornos que integran harnesses y marcos de agentes como OpenClaw, Hermes Agent, Claude Code, Qwen Paw y Qoder, con el objetivo de facilitar la interoperabilidad entre herramientas y extremos de ejecución.
Durante la presentación se mostró una prueba interna en la que Qwen 3.7‑Max ejecutó un encargo sin intervención humana sobre un chip Zhenwu M890 que no había formado parte de su entrenamiento. Según la compañía, el modelo trabajó de manera continua durante 35 horas, realizó más de 1.000 llamadas a herramientas y generó un kernel de computación de IA de grado de producción que, en ese ensayo, superó en diez veces la versión oficial del fabricante del chip.
Para dar soporte a los patrones de concurrencia que generan los agentes — ráfagas impredecibles y frecuentes de peticiones de inferencia — Alibaba presentó el servidor Panjiu AL128 Supernode. Se trata de una unidad a escala de rack que integra 128 aceleradores de IA y ofrece ancho de banda interno de petabytes por segundo (PB/s). El servidor está disponible a través de la plataforma de servicios de modelos Bailian (conocida como Model Studio fuera de China) y se acompaña de funciones específicas para agentes.
Entre esas funciones orientadas a agentes la compañía destacó Agentic RL, un esquema de aprendizaje por refuerzo destinado a ajustar modelos de forma continua según los resultados reales de tareas de agentes, así como mecanismos de gobernanza y seguridad integrados que, según Alibaba, mantienen a los agentes operando dentro de límites definidos. Estas capacidades buscan facilitar despliegues en producción donde la supervisión humana es limitada y los agentes deben reaccionar a condiciones cambiantes.
En la capa de hardware, T‑Head-la filial de diseño de chips de la compañía — formalizó el lanzamiento del procesador Zhenwu M890, descrito como su módulo de IA más potente hasta la fecha. Las cifras divulgadas señalan que el M890 ofrece tres veces el rendimiento del Zhenwu 810E, dispone de 144 GB de memoria on‑chip y 800 GB/s de ancho de banda inter‑chip, y soporta formatos de precisión que van desde FP32 hasta FP4 para combinar entrenamiento de alta precisión con opciones de inferencia más económicas y rápidas.
Además del M890, se presentó el ICN Switch 1.0, un chip de interconexión que, según la empresa, proporciona hasta 25,6 terabits por segundo (Tbps) de ancho de banda agregado y facilita comunicación sin congestión en clústeres de hasta 64 aceleradores. La compañía también lanzó T‑Head SAIL™, una pila de software destinada a extraer rendimiento de su hardware propietario; Alibaba señaló que estos componentes forman la base sobre la que opera el Panjiu AL128.
T‑Head reportó haber enviado más de 560.000 chips Zhenwu hasta la fecha y afirmó que más de 400 clientes externos en 20 industrias han desplegado sus chips, con implementaciones en sectores que incluyen fabricantes de automóviles y empresas de servicios financieros. Alibaba citó esos números como evidencia de una adopción industrial temprana de su silicio propio, en apoyo de su estrategia de ofrecer una pila completa para cargas agentic.
En el plano comercial, el CEO Eddie Wu indicó durante el último anuncio de resultados que la plataforma de modelos y aplicaciones de la empresa (ARR) superará los RMB 10.000 millones (aprox. US$1.4 millardos) en el trimestre de junio y proyecta RMB 30.000 millones (aprox. US$4.1 millardos) para fin de año. Wu pronosticó además que en aproximadamente un año los ingresos por productos relacionados con IA sobrepasarán a los de cómputo en la nube convencionales como la principal línea de ingresos del Cloud Intelligence Group.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.