Glosario técnico define 'harness' y 'scaffold' para desarrolladores de agentes de IA

News

5/26/2026, 3:24:24 AM

Glosario técnico define 'harness' y 'scaffold' para desarrolladores de agentes de IA

Un glosario publicado el 25 de mayo de 2026 por Sergio Paniego y Aritra Roy Gosthipaty clarifica las diferencias prácticas entre modelo, scaffold y harness para reducir ambigüedades en diseño, despliegue y evaluación de agentes de IA.

El 25 de mayo de 2026, los autores Sergio Paniego (sergiopaniego) y Aritra Roy Gosthipaty (ariG23498) publicaron un glosario destinado a fijar definiciones clave en el campo de los agentes de IA; la iniciativa responde a confusiones planteadas en foros como ICLR 2026 y se acompaña de una actualización en GitHub. El documento ofrece un marco práctico para que desarrolladores, investigadores y equipos de producto hablen con menos ambigüedad al construir, desplegar o evaluar agentes, lo que facilita la integración de componentes y la toma de decisiones técnicas.

El glosario parte de una definición concreta de “modelo”: un LLM que recibe texto y devuelve texto (se citan ejemplos como Claude, Qwen, GPT, Kimi y DeepSeek). Se puntualiza que, por sí solo, el modelo no mantiene memoria entre llamadas ni ejecuta bucles persistentes; puede expresar la intención de usar una herramienta, pero necesita capas externas para que esa intención se materialice operativamente.

“Scaffolding” se describe como la capa de comportamiento que rodea al modelo y condiciona su salida: incluye prompt de sistema, descripciones de herramientas, formatos para parsing y la gestión del contexto que determina qué recuerda el agente. Esta capa organiza cómo se formulan entradas y respuestas y qué información se preserva entre interacciones, por lo que influye directamente en la coherencia y utilidad del agente.

El “harness” se define como la capa de ejecución: el componente que invoca al modelo, procesa llamadas a herramientas y decide cuándo el agente debe detenerse. En el glosario se señalan productos que emplean explícitamente el término “harness” para referirse al conjunto operativo, con Claude Code citado como ejemplo de uso del vocabulario en la práctica.

El texto también aborda diferencias de implementación: algunos productos, como Claude Code o Codex, están fuertemente acoplados al proveedor del modelo, mientras que herramientas como Antigravity CLI y Hermes Agent permiten enchufar distintos modelos. Además, el documento reconoce que en ciertos contextos “scaffold” se usa de forma más amplia para abarcar hooks, configuración en tiempo de ejecución y estructura de directorios cuando eso ayuda a razonar sobre la infraestructura del agente.

En cuanto a entrenamiento y evaluación, el glosario subraya que distinguir scaffold y harness es crucial para pipelines: la ingeniería del harness incluye decisiones sobre cuándo parar, manejo de errores y guardrails; en evaluación se emplea un “eval harness” que ejecuta escenarios fijos sobre un checkpoint y registra métricas sin actualizar pesos. La separación facilita diseñar entrenamientos reproducibles y mediciones comparables entre configuraciones.

Fuentes

Hugging Face Blog · 5/25/2026

Respuestas (0)

Aún no hay respuestas en este tema.

Atrás