
В апреле 2026 года GitHub внедрил системную программу инструментирования и оптимизации расхода токенов в Agentic Workflows: ввёл единое логирование через прокси, сохраняет артефакты token — usage.
В апреле 2026 года команда GitHub начала системную программу по оптимизации расхода токенов в Agentic Workflows — реакция на рост счётов за API из‑за автоматических CI‑задач. Компания инструментировала производственные workflows и ввела единое сквозное измерение использования токенов, чтобы понять, где расходы накапливаются и какие именно агентные сценарии дают аномалии. Это важно для владельцев репозиториев и инженеров автоматизации: предсказуемые CI‑запуски можно системно оптимизировать и снизить постоянные издержки.
Чтобы унифицировать сбор данных, GitHub применил прокси API, который предотвращает прямой доступ агентов к учетным данным и одновременно генерирует единый поток метрик из разных агентных фреймворков — Claude CLI, Copilot CLI, Codex CLI — у которых были разные форматы логов и неполные исторические данные. Каждый workflow теперь сохраняет артефакт token — usage.jsonl с построчной записью вызова: input‑ и output‑токены, операции cache‑read/cache‑write, модель, провайдер и метки времени. Такая унификация позволила получать сопоставимые метрики по всем репозиториям и строить агрегированные отчёты.
На основе этих логов GitHub запустил два ежедневных агентных процесса. Daily Token Usage Auditor агрегирует артефакты и формирует структурированный отчёт по потреблению токенов, отмечая резкие скачки и аномалии — например, выполнение в 18 ходов вместо обычных четырёх. Daily Token Optimizer анализирует исходники и логи отмеченных workflows и автоматически создаёт Issues с конкретными описаниями неэффективностей и предложениями по исправлению. их поведение, будучи описанным в YAML и запускаемым по триггерам, предсказуемее интерактивных сессий и поэтому легче поддаётся системной оптимизации, однако расходы при этом могут «накапливаться вне поля зрения».
Одна из наиболее частых и конкретных неэффективностей — регистрация неиспользуемых MCP‑инструментов. Запросы включают JSON‑схемы инструментов, и полный список серверных инструментов MCP из ~40 элементов может добавлять 10 — 15 КБ схемы в каждый ход. Если агент реально использует только два инструмента, оставшиеся создают регулярный оверхед; Optimizer перекрёстно сверяет манифесты инструментов с фактическими вызовами и предлагает обрезать ненужные элементы. Практические результаты уже заметны: в smoke‑тестах удаление неиспользуемых инструментов уменьшало размер контекста на 8 — 12 КБ на запрос и экономило несколько тысяч токенов на запуск без изменения поведения агентов. При этом аудит и оптимизатор сами попадают в ежедневные отчёты, создавая «доброкачественную петлю» улучшений — найденные проблемы фиксируются автоматически и затем снова мониторятся.
инструментируйте расход токенов через прокси, агрегируйте данные и системно удаляйте неиспользуемые элементы конфигурации, чтобы контролировать постоянно растущие расходы.
Источники
Ответы (0)
Пока нет ответов в этой теме.