20 мая 2026 года представили Running Guide agent — систему, которая позволяет слепым и слабовидящим (BLV) бегунам обходиться без физического поводка или нарисованной линии, давая голосовые инструкции и экстренные команды в реальном времени. Это важно потому, что проект ориентирован на обеспечение автономности и безопасности бегунов при высокой скорости и в условиях риска; по замыслу разработчиков агент сокращает зависимость от внешней помощи и даёт бегунам больше самостоятельности.
Технически платформа использует гибридную on‑device архитектуру. Носимый грудной Pixel 10 Pro с собственным чипом выполняет офлайн‑сегментацию для сверхнизкой задержки и моментальных команд «STOP» и направляющих тактов, а модель Gemma 4 (E4B) работает на том же устройстве для сложного мультимодального понимания сцены и планирования. Для экономии времени отклика применяется Smarter Frame Selection — система, которая в первую очередь обрабатывает «высокоэнтропийные» кадры, то есть те, где происходят резкие изменения рельефа или появляются новые препятствия.
Архитектура оформлена как многосубъектная (multi‑agent) система с разделением ролей. Planner агент вызывает функции Gemma 4, получает прогноз погоды и данные Google Maps, общается с бегуном для установки целей и калибровки цифровой стартовой линии. Coach агент выдаёт краткие голосовые предупреждения по иерархии DANGER, WARNING и NOTICE, а Break агент управляет паузами и возобновлением тренировки. Такое разделение задач призвано упростить реактивность, модульность и предсказуемость системы.
Прототип также переносится на «умные» очки: в форме очков система получает более широкое и стабильное поле зрения для мультимодальных моделей, что должно повысить качество обнаружения окружения по сравнению с единичной грудной камерой. В публикации подчёркивают, что сочетание нулевой задержки экстренной локальной детекции и глубокой контекстной аналитики на устройстве направлено на довериемость, необходимую для безопасности BLV‑бегунов. Команду по тестированию включили представителей сообщества: инженеры подключили SG Enable (фокусное агентство Сингапура по вопросам инвалидности и инклюзии) для полевых испытаний с реальными BLV‑бегунами и итеративной доработки. В документе не указаны сроки широкой доступности — проект остаётся экспериментальным и тестовым.
С технической точки зрения ключевые паттерны для инженеров и разработчиков — комбинирование детерминированной локальной обнаруживающей подсистемы для экстренных реакций с более сложной on‑device reasoning моделью для планирования и коммуникации; использование Smarter Frame Selection для уменьшения нагрузки обработки; а также разбивка функций между Planner, Coach и Break агентами для повышения отзывчивости и модульности приложения.
Источники
Ответы (0)
Пока нет ответов в этой теме.