
Egocentric‑видео-записи «от первого лица» с крупными планами рук — становятся ключевым сырьём для обучения гуманоидных роботов тонкой моторике, и журналист подтвердил это на практике, записывая себя в быту в надежде получить плату за данные. Эти короткие кадры, снятые через крепление для смартфона на голове или через встроенные в приложения инструменты, дают последовательности действий, которых не хватает в обычных видеокорпусах, и потому важны для достижений в манипуляциях роботов.
В течение недели автор фиксировал бытовые операции камерой, закреплённой на голове: нарезал огурец, мыл посуду, готовил, складывал бельё и нёс мусор, заостряя внимание на крупных планах пальцев и движений. Цель съёмок — получить кадры, которые помогут роботам освоить тонкие двигательные навыки — например, влить воду в стакан, не пролив, или аккуратно завязать мешок. Такие непрерывные кадры с фокусом на руках дают нужный тренинговый сигнал для систем обратной связи при обучении манипуляций.
Автор тестировал сразу несколько платформ, которые платят за подобные задания: Kled, Luel и Waffle Video; DoorDash ранее в этом году выпустил отдельное приложение Tasks, но оно не было доступно в Калифорнии для автора. Kled заявляет о примерно 300 000 пользователях и принимает не только отдельные видео‑задания, но и полные загрузки фотогалерей и роллов. В приложении у Kled есть раздел «special tasks», где пользователи выбирают задание из списка и снимают его прямо через приложение; каждое задание помечено как низко, средне или высокооплачиваемое, но конкретные суммы часто не публикуются.
Рынок данных для обучения роботов быстро растёт: инвесторы ожидают, что ведущие компании смогут закупить сотни миллионов часов сторонних видеоданных для тренировки моделей и автономных систем. Прорывный момент для Kled, по словам основателя Avi Patel, наступил после ролика Пателя на платформе X, который набрал свыше 4 млн просмотров и привлёк запросы «каждой крупной фундаментальной модели и лаборатории». Разработчикам такие гиперконкретные клипы нужны, потому что веб‑скрапинг и обычные видео редко содержат последовательные крупные планы рук и детальные шаги действий. Короткие, непрерывные кадры того, как завязывают мешок с мусором или заворачивают платок, повышают качество обратной связи в обучении и помогают избежать «промахов» при переносе навыков с данных на физического робота.
Экономические последствия для исполнителей туманны: автор отмечает, что его заработок оказался ничтожен по сравнению с месячной арендой в Сан‑Франциско — $2 500. В странах вроде Индии такие задания уже набирают популярность на фоне среднего дохода самозанятых около $125 в месяц. Kled заявляет, что в течение месяца обновит приложение и укажет ставки для многих, но не всех заданий, что оставляет открытыми вопросы о прозрачности и устойчивости нового сегмента гиг‑работы.
Источники
Ответы (0)
Пока нет ответов в этой теме.