Unity AI Gateway выпустил в бета‑версии четыре расширения, которые сводят управление выполнением AI‑интеракций в один слой: LLM‑ограничения (guardrails), контроль затрат, логирование payload для MCP и сервисные политики для MCP. Это важно, потому что объединённый уровень контроля адресует критические операционные риски — непредсказуемое поведение агентов, пробелы в наблюдаемости и быстро растущие расходы у команд, работающих с несколькими провайдерами и моделями.
Технически релиз включает четыре отдельных механизма. LLM‑guardrails применяются в реальном времени: модель с промптом оценивает входы, выходы или обе стороны и применяет заданные правила. Логирование полезной нагрузки сохраняет полные запросы и ответы для MCP‑вызовов. Сервисные политики определяют, какие инструменты агент может вызвать, опираясь на идентичность пользователя и контекст запроса. Контроль затрат обеспечивает покомандную атрибуцию токенов и поддерживает уведомления и жёсткие лимиты по пользователям. Все нововведения интегрированы в единую экосистему через Unity Catalog: централизованная запись вызовов и «governed inference tables» дают сквозную видимость и аудит. Покомандная атрибуция стоимости и пер‑юзер оповещения позволяют автоматически останавливать или ограничивать потребление при превышении бюджета, что снижает риск «бесконтрольных» расходов и упрощает соответствие внутренним политикам компании.
Авторы релиза подчёркивают практическую направленность решения: цель — помочь командам разработки и платформенным инженерам быстрее выдвигать агентные системы в производство с предсказуемым поведением и контролируемыми затратами. В блоге приводятся отзывы клиентов: Erik Meijer (Definitive Healthcare) отмечает потребность в надёжном управлении при работе с медицинскими данными, а Jeff Hepburn (Ibotta) указывает на преимущества единой архитектуры для ускорения доставки и снижения операционных рисков. Бета‑статус позволяет командам тестировать политики и наблюдаемость в контролируемой среде: применять готовые или кастомные guardrails, задавать жёсткие лимиты по пользователям и отслеживать полный payload для MCP‑вызовов. По замыслу разработчиков, сочетание правил доступа, мониторинга и контроля стоимости делает внедрение агентных систем более предсказуемым и готовым к промышленной эксплуатации.

Источники
Ответы (0)
Пока нет ответов в этой теме.