Aivizor
Aivizor
СкиныКреативыСообщество
Назад
  1. Сообщество
  2. /
  3. Amazon

Nova 2 Lite на Bedrock выполняет детекцию объектов без дообучения и развёртывается за часы

Новость
А
Андрей Ковалев
Редактор аналитических материалов

6/2/2026, 10:16:24 PM

Nova 2 Lite на Bedrock выполняет детекцию объектов без дообучения и развёртывается за часы

Amazon Nova 2 Lite через платформу Bedrock позволяет выполнять детекцию и локализацию объектов на изображениях без дополнительного обучения модели и без управления инфраструктурой — решение можно прототипировать и развернуть за часы, что облегчает работу небольших команд и ускоряет переход к продакшену. В опубликованном пошаговом гайде показано end-to-end приложение: отправка изображения и списка объектов в запросе, вызов Bedrock (Converse API), получение структурированного JSON с координатами обнаруженных объектов и отрисовка рамок для валидации. Авторы подчёркивают, что весь цикл работает без дообучения модели и без отдельного пайплайна тренировки.

Nova 2 Lite-мультимодальная базовая модель, которая по текстовым подсказкам находит указанные элементы и возвращает точные координаты ограничивающих прямоугольников в чистом JSON. Координаты приходят в нормализованной шкале 0 — 1000; в приложении их переводят в пиксели по размерам исходного изображения и рисуют боксы в формате [x_min, y_min, x_max, y_max] для каждой найденной сущности.

Развёртывание, по оценке авторов гайда, занимает 30 — 45 минут — то есть минуты и часы вместо недель на настройку датасетов и обучения. Приведённые расчёты стоимости Bedrock: $0.0003 за 1000 входных токенов и $0.0025 за 1000 выходных токенов. Типичное изображение использует примерно 230 входных токенов (~$0.000069) и ~200 выходных токенов (~$0.0005), поэтому обработка 10 000 изображений обойдётся примерно в $5.69. Отдельно тарифицируются вызовы AWS Lambda и Amazon API Gateway.

Практическая архитектура решения описана в четырёх ключевых шагах: 1) prompt engineering — формирование подсказки и схемы вывода; 2) вызов Amazon Bedrock через Converse API для анализа изображения и получения JSON; 3) обработка координат — перевод нормализованных значений в пиксели; 4) визуализация — отрисовка рамок для проверки и UI. Для продакшен‑развёртывания авторы используют AWS Lambda и Amazon API Gateway. Требования к окружению и советы по интеграции включают: AWS‑аккаунт с доступом к Bedrock и IAM‑право bedrock: InvokeModel, AWS CLI для деплоя, рабочее окружение разработки, Python 3.8+ и библиотечные зависимости: boto3 версии 1.28.0+ и Pillow. Для установки библиотек авторы рекомендуют pip install boto3 pillow.

Особое внимание в гайде уделено prompt engineering: шаблон подсказки динамически формирует переменные elements и schema и требует строго JSON‑выхода без лишнего текста. В инструкции модель просят «мыслить шаг за шагом», детектировать все указанные элементы, не дублировать рамки и плотно подгонять коробки вокруг объектов — это упрощает парсинг ответа Nova 2 Lite и интеграцию в production‑логику приложений.

Источники

  1. AWS Machine Learning Blog · 6/2/2026
0
0
0

Ответы (0)

Пока нет ответов в этой теме.

9:41