Aaron Erickson на QCon AI представил архитектуры для надёжных и масштабируемых AI‑платформ

Новость

Редактор новостной ленты

5/27/2026, 9:33:06 AM

Aaron Erickson на QCon AI представил архитектуры для надёжных и масштабируемых AI‑платформ

На QCon AI Aaron Erickson (Applied AI Lab для DGX Cloud, NVIDIA) в докладе «Tools for Certainty, Agents for Discovery» представил набор архитектурных приёмов для надёжного масштабирования AI:

Aaron Erickson в докладе «Tools for Certainty, Agents for Discovery», представленном на QCon AI (видео длится 52:06), изложил конкретные архитектурные подходы для создания надёжных AI‑платформ, способных безопасно масштабироваться в продакшене. Это важно, потому что переход от прототипов к промышленным системам требует не только экспериментальных агентов, но и гарантий корректности и наблюдаемости на всех уровнях. Ключевые идеи доклада — комбинировать детерминированные программные guardrails, дающие формальные гарантии поведения, с агентной (agentic) логикой, обеспечивающей исследование и адаптацию. Эриксон предложил оптимизировать иерархию агентов, чтобы снизить неопределённость принятия решений, назначая агентам разные роли и уровни ответственности в зависимости от рабочей нагрузки.

Для задач типа обнаружения аномалий Эриксон рекомендовал применять time‑series foundation models, адаптированные под временные ряды и характерные паттерны данных. Такие модели в паре с агентной логикой и детерминированными проверками расширяют возможности обнаружения и объяснения необычного поведения систем в продакшене. Отдельная архитектурная рекомендация — строить «пирамиду оценки» для многоступенчатого тестирования: юнит‑тесты и проверка компонентов, интеграционные тесты, симуляции рабочих сценариев и наблюдение в продакшене. По словам докладчика, эта последовательность помогает выявлять деградацию моделей и проблемные системные паттерны на ранних этапах, до того как они повлияют на пользователей.

Доклад опирался на практический опыт автора: Эриксон основал Applied AI Lab для DGX Cloud при NVIDIA, где команда разрабатывает foundation‑модели и агентные системы, включая решения, ориентированные на анализ временных рядов. Ранее он руководил инженерными командами в ThoughtWorks и New Relic и был соучредителем Orgspace — пример из работы Orgspace (попытка интегрировать плагин для генерации планов реорганизации на базе ChatGPT) иллюстрирует переход от спонтанного «vibe checking» на LLM к необходимости формализованных и проверяемых фреймворков. Практическое следствие для инженеров и архитекторов — не отвергать агентные подходы, а ограничивать их детерминированными слоями и системами проверки. Измерять и контролировать поведение следует сквозь все уровни пирамиды оценки: от локальных тестов до продакшен‑мониторинга и симуляций, чтобы гарантировать повторяемость и безопасность.

Итоговый месседж доклада — сдвиг от экспериментов к промышленной инженерии: строить платформы, где инструменты дают уверенность, а агенты служат для открытия и адаптации. Оптимизация иерархий агентов под конкретные рабочие нагрузки (например, time‑series anomaly detection) и строгое применение методик оценки позволят архитектурам реально масштабироваться в продакшене.

Источники

InfoQ AI/ML · 5/27/2026

Ответы (0)

Пока нет ответов в этой теме.