
QCon AI Boston 2026 пройдёт 1–2 июня в George Sherman Union при Boston University и близка к распродаже билетов; в программе более 40 сессий, шесть из которых прямо посвящены практическим проблемам перевода agentic AI в рабочие системы. Эти выступления важны для инженеров и менеджеров, которые сталкиваются с типичными сбоями после первых месяцев эксплуатации и ищут проверенные архитектуры и операционные практики.
В ключевом докладе Martin Spier (ChatGPT Performance, OpenAI) задержки рассматриваются как системная задача, а не только как отсутствие GPU. Он разбивает путь одного запроса на этапы — клиентская логика, загрузка разговора, сбор контекста, токенизация, маршрутизация, инференс, стриминг и наблюдаемость — и подчёркивает, что любой слой может стать бутылочным горлышком. Spier также предостерегает, что ускоренная доставка через agentic coding повышает риск накопления регрессий и описывает подход OpenAI к «agent‑operated» расследованиям с телеметрией и инструментами, понятными агентам.
Ajay Prakash (LinkedIn) представит CAPT-контекстный слой на базе MCP для внутренних агентных решений, который компенсирует то, что агенты не знают внутренних сервисов, фреймворков, данных и рабочих процессов компании. Значительная часть доклада посвящена истории развёртывания: что не сработало на старте, как система эволюционировала и какие организационные изменения потребовались. LinkedIn сообщает о 70% ускорении триажа инцидентов и более чем 500 навыках, созданных сообществом инженеров.
Vinoth Govindarajan (OpenAI) выдвигает тезис, что автономность агентов иллюзорна без инфраструктуры вокруг модели — «арматуры», включающей плоскости управления, состояние сессий, single‑writer исполнение, троттлинг, границы инструментов, пути утверждений и аудитируемость. В качестве практического кейса он приводит OpenClaw: события входят в систему, состояние восстанавливается по сессии, исполнение ограничено, инструменты контролируются на границах, а критические операции оставляют аудиторский след.
Susan Chang (Elastic) делится опытом создания повторно используемых фреймворков оценки для agentic AI; её команда эксплуатирует пользовательского агента почти два года, в отличие от большинства историй продакшна с возрастом менее шести месяцев. Она описывает методы оценки, централизованный фреймворк, применимый к разным GenAI‑продуктам, и замкнутый цикл обратной связи от оценок обратно в улучшение продукта — это помогает подбирать шаблоны оценок для конкретных режимов отказов.
Сквозные выводы для инженеров и операторов: проблемы продакшна чаще системные и организационные, а не только модельные. Повторяющиеся рецепты включают контекстные слои, плоскости контроля, единые фреймворки оценки и платформу, чтобы избежать неоднократной сборки «LLM‑плагина» каждой командой (пример DoorDash). Предстоящие сессии обещают конкретные архитектуры, метрики и операционные практики, которые команды могут сразу применить при переходе от демо к устойчивому сервису.
Источники
Ответы (0)
Пока нет ответов в этой теме.