
QCon IA Boston 2026, que se celebrará el 1 y 2 de junio en el George Sherman Union de Boston University, está casi agotado y pone el foco en la transición de demostraciones a sistemas de IA en producción. Entre más de 40 charlas, destaca seis sesiones orientadas a problemas operativos y arquitectónicos reales — desde latencia hasta gobernanza de agentes — cuya resolución es crítica para que las empresas escalen aplicaciones GenAI sin quedarse en prototipos.
En la keynote "Keeping ChatGPT Fast in the Agentic Era", Martin Spier (ChatGPT Performance, OpenAI) sostiene que la latencia no es un problema exclusivo de la GPU: una petición pasa por carga de conversación, ensamblado de contexto, tokenización, enrutamiento, inferencia, streaming y observabilidad, y cualquiera de esas capas puede convertirse en cuello de botella. Spier advierte además que la codificación agentic acelera la aparición de regresiones y describe cómo OpenAI está reorientando la ingeniería de rendimiento hacia investigaciones operadas por agentes, apoyadas en telemetría y herramientas legibles por agentes.
Ajay Prakash (Senior Staff Software Engineer, LinkedIn) presenta "Context Engineering at LinkedIn" y relata la creación de CAPT, una capa organizacional de contexto construida sobre MCP para agentes de IA. qué falló al principio, cómo evolucionó el sistema y resultados medibles, como una reducción del 70% en el tiempo de triage de incidencias y más de 500 skills desarrolladas por la comunidad interna.
Vinoth Govindarajan (OpenAI) adopta una postura pragmática respecto a los agentes: su aparente autonomía requiere un arnés para garantizar seguridad y control. Su charla, usando OpenClaw como estudio de caso, define ese arnés en términos técnicos: planos de control, estado por sesión, ejecución con único escritor, limitación de herramientas, caminos de aprobación y auditoría. El mensaje central es que muchas garantías de fiabilidad son problemas de sistemas y operación, no sólo de la arquitectura del modelo.
Susan Chang (Principal Data Scientist, Elastic) comparte lecciones tras casi dos años operando un agente orientado a usuarios en producción. Su equipo documentó métodos de evaluación reutilizables y construyó un framework centralizado para aplicar dichas evaluaciones a otros productos GenAI; además describe el bucle de retroalimentación que conecta las evaluaciones con mejoras de producto, útil para emparejar patrones de evaluación con modos de fallo concretos.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.