
Amazon OpenSearch Serverless (NextGen) обещает мгновенное авто‑масштабирование от нуля до тысяч запросов в секунду и автоматическое возвращение к нулю при простое — ключевое преимущество для агентных AI‑нагрузок, которым требуются быстрый отклик и экономия ресурсов. Платформа позиционируется как полностью управляемый поисковый и векторный движок, который создаёт необходимые ресурсы за считанные секунды и, по данным разработчиков, увеличивает доступную ёмкость до 20 раз быстрее, чем предыдущее поколение. На старте система поддерживает два типа коллекций — SEARCH и VECTORSEARCH — с возможностью «express create» в консоли, где задаются автоматические параметры и сопоставимые политики безопасности; при необходимости доступна опция «Switch to Classic» для возврата к инфраструктуре предыдущей версии.
Для интеграции в CI/CD и автоматизации сервис предоставляет AWS CLI и SDK: в документации приведён пример создания группы коллекций с параметрами capacity limits, включая maxIndexingCapacityInOCU: 10 и maxSearchCapacityInOCU: 10 при minIndexing и minSearch, равных 0, и указанием региона (пример — us‑east‑1). Это позволяет разработчикам программно создавать коллекции, наследовать настройки от групп коллекций и включать среду поиска и векторного поиска в конвейеры развёртывания.
Платформа также содержит нативные интеграции с инструментами хостинга и разработки — создание или подключение коллекции возможно прямо из консоли Vercel, поддерживаются рабочие процессы в Kiro, а для быстрого прототипирования заявлена совместимость с ассистентами и инструментами вроде Claude Code и Cursor. Дополнительно доступны OpenSearch Agent Skills и Launchpad в Kiro Powers с готовыми навыками и архитектурными руководствами для встраивания поисковой логики в агентов.
Коммерческая модель тарификации основана на единицах OpenSearch Compute Units (OCUs): оплата вычислений идёт в OCU для индексации, поиска и GPU‑ускорения, хранение — отдельно по GB‑month. AWS утверждает, что при корректном использовании режима scale‑to‑zero и авто‑масштабирования можно достичь до 60% снижения затрат по сравнению с кластерами, рассчитанными на пиковую нагрузку. Следующее поколение уже доступно в коммерческих регионах, где ранее был доступен OpenSearch Serverless. Для команд разработчиков это означает более быструю развёртку production‑готовых поисково‑векторных бэкендов, меньшие начальные расходы на инфраструктуру и упрощённую интеграцию с инструментами для агентов; обратная связь принимается через AWS re: Post и стандартные каналы поддержки.
Источники
Ответы (0)
Пока нет ответов в этой теме.