
За последние два года проекты с открытым ПО в робототехнике сместили акцент с аппаратуры на высокоуровневые функции — рассуждение, планирование и исполнение сложных действий роботами.
NVIDIA, Hugging Face и другие крупные игроки в последние два года выпустили открытые модели и инструменты, рассчитанные на то, чтобы дать роботам способности к рассуждению, планированию и выполнению сложных задач. Эти релизы смещают фокус от чисто аппаратной инфраструктуры к программным слоям, которые сокращают объём работы по созданию «мыслящих» роботов и могут снизить барьеры входа для разработчиков и компаний. NVIDIA сформировала открытую стековую экосистему для полного конвейера разработки роботов: Cosmos обеспечивает генерацию синтетических обучающих данных и симуляцию физических сред; модели GR00T предназначены для рассуждения и исполнения сложных задач; фреймворки Isaac координируют обучение, симуляцию и развёртывание. Все открытые модели NVIDIA размещены на платформе Hugging Face, что упрощает их доступ и интеграцию в проекты.
Hugging Face в мае 2024 года запустила LeRobot — сообщественную платформу для ИИ в робототехнике, которая служит центром обмена моделями и наборами данных. При этом многие эксперты подчёркивают, что для роста экосистемы важнее доступ к качественным предобученным моделям и возможность их дообучения, чем постоянная переконфигурация систем с нуля; наличие таких моделей ускоряет внедрение и эксперименты.
Корни движения открытого ПО в робототехнике уходят в 1990‑е и 2000‑е годы. Ранними шагами были межпроцессные пакеты в Carnegie Mellon и проект Player начала 2000‑х; прорывным стал Robot Operating System (ROS), появившийся в 2007 году. Несмотря на название, ROS не является операционной системой, а программным фреймворком поверх Linux, который берёт на себя передачу данных между компонентами, взаимодействие с аппаратурой, построение карт, планирование траекторий и предоставляет набор инструментов для разработчиков.
Сторонники открытости подчёркивают практическую выгоду таких подходов. Брайан Герки, который помогал создавать ROS, называет себя «строителем инструментов» и объясняет, что открытый обмен результатами даёт больший эффект. Спенсер Хуанг из NVIDIA указывает, что задачи компьютерного зрения, ранее требовавшие глубокой экспертизы, теперь решаются «несколькими строками кода», и «чтобы войти в робототехнику, больше не нужен Ph.D.», что расширяет круг участников и ускоряет инновативные проекты.
Последствия этих изменений пока предварительны, но могут быть значительными: если открытая модельная и инструментальная инфраструктура приживётся в робототехнике, порог создания способных роботов может упасть так же стремительно, как снизился порог разработки приложений в области ИИ. Авторы и эксперты также предупреждают о ключевом операционном моменте — доступе к предобученным моделям: «если закрыть предобучение, поле не будет расти», поэтому открытые качественные предобученные модели считаются критическим фактором дальнейшего развития.
Источники
Ответы (0)
Пока нет ответов в этой теме.