Databricks integra GPT-5.5 en flujos de agentes tras nuevo récord en OfficeQA Pro

News

5/16/2026, 3:37:19 AM

Databricks integra GPT-5.5 en flujos de agentes tras nuevo récord en OfficeQA Pro

Databricks ofrece GPT-5.5 para flujos de agentes empresariales después de que el modelo alcanzara un nuevo récord en el benchmark OfficeQA Pro, donde mejoró extracción, recuperación y razonamiento sobre documentos largos y complejos.

El 15 de mayo de 2026 Databricks anunció la disponibilidad de GPT-5.5 para clientes empresariales como componente de sus flujos de agentes. La compañía vinculó este despliegue a resultados obtenidos en OfficeQA Pro, el benchmark desarrollado por su propio equipo para medir la capacidad de los modelos en parsing, recuperación y razonamiento sobre documentos extensos, incluidos PDFs escaneados y archivos heredados.

En la configuración denominada "agent — harness", Databricks informó que GPT-5.5 redujo los errores en un 46% frente a GPT-5.4 y se convirtió en el primer modelo en superar el 50% de precisión en OfficeQA Pro. Esos números se presentan como una mejora puntual sobre la versión anterior y como un indicador de mayor robustez al trabajar con documentos que contienen texto impreso, números mal escaneados y contextos largos que complican la extracción automática.

El equipo de investigación de Databricks destacó los resultados en comparación directa con su versión 5.4 y con sus métricas internas. Arnav Singhvi, research engineer, resumió el avance afirmando: "Codex with 5.5 is now state — of-the-art amongst all the agents and models out there." La compañía presentó este hito como un progreso medible en tareas concretas de manejo documental dentro de entornos de producción.

Para su despliegue operativo, Databricks ofrece GPT-5.5 a través de IA Unity Gateway, integrado en flujos construidos con AgentBricks y aprovechando el Agent Supervisor API. En esos entornos el modelo no solo realiza parsing y recuperación, sino que actúa como un orquestador que supervisa la interacción entre agentes especializados, delegando y coordinando la ejecución de pasos en pipelines complejos sin intervención constante.

Además del avance en precisión de parsing, la compañía reportó mejoras en la orquestación de tareas multi‑paso. Según Databricks, modelos previos como la versión 5.4 tendían a tomar desvíos de búsqueda innecesarios que generaban trayectorias menos eficientes; GPT-5.5 mostró mayor fiabilidad al recuperar contexto relevante y completar flujos complejos de forma más directa. En palabras de Singhvi: "GPT-5.5 has been great in terms of knowledge lift. It's a step size function change in terms of doing knowledge work for us."

Para clientes empresariales, la combinación de mayor precisión y capacidad de orquestación puede traducirse en menos intervenciones manuales en pipelines que procesan documentos heredados, mayor velocidad en tareas de extracción y menores tasas de error en agentes de producción que manejan PDFs escaneados o archivos largos. Esas mejoras afectan tanto la etapa de parsing inicial como las sucesivas fases de recuperación y razonamiento automatizado.

Databricks también señaló las limitaciones del anuncio: los resultados comunicados proceden del benchmark OfficeQA Pro y de pruebas internas del laboratorio, sin detallar en la nota de anuncio precios, calendario público de despliegue ni métricas de validación independiente. Eso implica que, aunque los indicadores internos son prometedores, falta información externa y datos de adopción real en entornos de clientes diversos.

Fuentes

OpenAI News · 5/15/2026

Respuestas (0)

Aún no hay respuestas en este tema.

Atrás