
Nous Research добавила в Hermes Agent опциональную функцию Tool Search, которая отключена по умолчанию и предназначена для уменьшения перегрузки контекста при работе с множеством MCP‑инструментов и плагинов. Это важно: по данным Anthropic, внедрение подобной отложенной загрузки схем инструментов не только резко сокращает использование токенов, но и повышает точность оценок моделей Claude Opus. Tool Search меняет способ предоставления описаний инструментов: вместо передачи всех JSON‑схем при каждом ходе модель получает механизм отложенного доступа к каталогу инструментов и подгружает только необходимые схемы по запросу. Каталог формируется на каждой сборке заново (stateless), чтобы избежать рассинхронизации с актуальным набором определений.
Вместо подробных схем в видимом массиве tools Tool Search использует три «мостовых» вызова: tool_search(query, limit? ) для поиска по каталогу, tool_describe(name) для загрузки полной схемы одного инструмента и tool_call(name, arguments) для непосредственного вызова отсроченного инструмента. Типичный сценарий — поиск релевантных кандидатов, затем загрузка параметров выбранного инструмента и выполнение вызова с конкретными аргументами; при этом все хуки, guardrails и approval‑промпты привязаны к реальному имени инструмента, а не к мосту.
Проблема переполнения контекста ясна на примере: в одном Hermes‑деплойменте с пятью MCP‑серверами и 34 инструментами средний размер промпта за ход достигал 45 000 токенов, из которых около 22 000 токенов (примерно 50%) приходились на схемы инструментов. По данным инжиниринга Anthropic, до оптимизаций определения инструментов могли занимать до 134 000 токенов, а метрики Tool Attention фиксируют «налог» в диапазоне 15 000 — 60 000 токенов для типичных мульти‑серверных развертываний.
Помимо уменьшения объёма контекста, включение Tool Search показало заметный прирост точности на MCP‑оценках Anthropic: для Claude Opus 4 точность выросла с 49% до 74%, а для Opus 4.5 — с 79,5% до 88,1%. При этом отмечено примерно 85% сокращение использования токенов на определения инструментов при сохранении доступа ко всей библиотеке, что снижает ложные срабатывания и «паралич выбора» в больших каталогах. Технически поиск основан на классическом BM25, который сопоставляет запрос модели с названиями, описаниями и именами параметров инструментов; при отсутствии высоких оценок BM25 применяется подстраховочный подстрочный поиск по имени инструмента. Механизм пересматривается на каждом ходе, поэтому в сессиях с малым числом инструментов или с моделями, имеющими большой контекст, функция может и не активироваться.
полный каталог остаётся доступным, модель видит только релевантные варианты, что снижает стоимость вызовов при cache‑miss и уменьшает риск принятия неверных действий; безопасность и механизмы одобрения сохраняются, поскольку операции выполняются по реальным именам инструментов.
Источники
Ответы (0)
Пока нет ответов в этой теме.