
GitHub publicó los resultados de un proyecto interno para reducir el consumo de tokens en workflows que ejecutan agentes LLM, logrando ahorros de hasta 62% en flujos de producción tras auditar llamadas a modelos y herramientas auxiliares y aplicar cambios operativos. Esto impacta directamente el coste y la sostenibilidad de pipelines de integración continua que dependen de agentes LLM y permite detectar regresiones de gasto de forma temprana.
Como parte del trabajo, la empresa genera por ejecución un artefacto token — usage.jsonl — que normaliza tokens de entrada, salida y caché entre Claude CLI, Copilot CLI y Codex CLI. Introdujo la métrica Effective Tokens (ET), calculada con salida ×4 y lecturas de caché ×0.1, y aplica multiplicadores por modelo (Haiku 0.25, Sonnet 1.0, Opus 5.0) para comparar consumo entre variantes.
Para operar el control, GitHub desplegó dos agentes diarios: el Daily Token Usage Auditor, que agrega consumo y detecta ejecuciones anómalas, y el Daily Token Optimiser, que analiza código y logs, abre issues y propone correcciones. Esos agentes automatizan la detección de patrones de gasto y facilitan intervenciones proactivas en los repositorios.
En las optimizaciones técnicas detectaron como ineficiencia frecuente las herramientas MCP no usadas: un servidor MCP con 40 herramientas puede añadir 10 — 15 KB de esquema por turno; eliminar entradas no usadas redujo alrededor de 8 — 12 KB por llamada en pruebas. Además, reemplazaron llamadas MCP para obtener diffs y contenidos por comandos gh CLI precargados o por un proxy HTTP transparente que aísla tokens de autenticación.
Los resultados en una docena de workflows de producción mostraron ahorros concretos y sostenidos: Auto‑Triage Issues alcanzó una reducción de 62% en ET tras 109 ejecuciones post‑arreglo; Security Guard 43%; Smoke Claude 59%; Daily Community Attribution 37%. GitHub concluye que la combinación de artefactos normalizados, la métrica ET y los agentes auditor/optimizador ayuda a controlar costes recurrentes en CI con agentes LLM y a detectar regresiones de gasto.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.