Aivizor
Aivizor
СкиныКреативыСообщество
Назад
  1. Сообщество
  2. /
  3. GitHub

GitHub снизил расход токенов в Agentic Workflows с помощью ежедневного аудита и автоматических правок

Новость
А
Анна Соколова
Редактор новостной ленты

5/7/2026, 11:56:01 PM

GitHub снизил расход токенов в Agentic Workflows с помощью ежедневного аудита и автоматических правок

В апреле 2026 года GitHub внедрил системную программу инструментирования и оптимизации расхода токенов в Agentic Workflows: ввёл единое логирование через прокси, сохраняет артефакты token — usage.

В апреле 2026 года команда GitHub начала системную программу по оптимизации расхода токенов в Agentic Workflows — реакция на рост счётов за API из‑за автоматических CI‑задач. Компания инструментировала производственные workflows и ввела единое сквозное измерение использования токенов, чтобы понять, где расходы накапливаются и какие именно агентные сценарии дают аномалии. Это важно для владельцев репозиториев и инженеров автоматизации: предсказуемые CI‑запуски можно системно оптимизировать и снизить постоянные издержки.

Чтобы унифицировать сбор данных, GitHub применил прокси API, который предотвращает прямой доступ агентов к учетным данным и одновременно генерирует единый поток метрик из разных агентных фреймворков — Claude CLI, Copilot CLI, Codex CLI — у которых были разные форматы логов и неполные исторические данные. Каждый workflow теперь сохраняет артефакт token — usage.jsonl с построчной записью вызова: input‑ и output‑токены, операции cache‑read/cache‑write, модель, провайдер и метки времени. Такая унификация позволила получать сопоставимые метрики по всем репозиториям и строить агрегированные отчёты.

На основе этих логов GitHub запустил два ежедневных агентных процесса. Daily Token Usage Auditor агрегирует артефакты и формирует структурированный отчёт по потреблению токенов, отмечая резкие скачки и аномалии — например, выполнение в 18 ходов вместо обычных четырёх. Daily Token Optimizer анализирует исходники и логи отмеченных workflows и автоматически создаёт Issues с конкретными описаниями неэффективностей и предложениями по исправлению. их поведение, будучи описанным в YAML и запускаемым по триггерам, предсказуемее интерактивных сессий и поэтому легче поддаётся системной оптимизации, однако расходы при этом могут «накапливаться вне поля зрения».

Одна из наиболее частых и конкретных неэффективностей — регистрация неиспользуемых MCP‑инструментов. Запросы включают JSON‑схемы инструментов, и полный список серверных инструментов MCP из ~40 элементов может добавлять 10 — 15 КБ схемы в каждый ход. Если агент реально использует только два инструмента, оставшиеся создают регулярный оверхед; Optimizer перекрёстно сверяет манифесты инструментов с фактическими вызовами и предлагает обрезать ненужные элементы. Практические результаты уже заметны: в smoke‑тестах удаление неиспользуемых инструментов уменьшало размер контекста на 8 — 12 КБ на запрос и экономило несколько тысяч токенов на запуск без изменения поведения агентов. При этом аудит и оптимизатор сами попадают в ежедневные отчёты, создавая «доброкачественную петлю» улучшений — найденные проблемы фиксируются автоматически и затем снова мониторятся.

инструментируйте расход токенов через прокси, агрегируйте данные и системно удаляйте неиспользуемые элементы конфигурации, чтобы контролировать постоянно растущие расходы.

Источники

  1. GitHub Generative AI · 5/7/2026
0
0
0

Ответы (0)

Пока нет ответов в этой теме.

9:41