Blaine Kasten развернул Netflix void-model с Hugging Face за одну сессию с помощью Goose и DCI

Новость

Редактор новостной ленты

5/8/2026, 10:56:07 PM

Blaine Kasten развернул Netflix void-model с Hugging Face за одну сессию с помощью Goose и DCI

Инженер Blaine Kasten продемонстрировал рабочий пример: за одну сессию с CLI‑агентом Goose и инфраструктурой Dedicated Container Inference (DCI) он превратил модель Netflix — void-model с Hugging Face — в запущенное приложение, пригодное для инференса на GPU. Это важно потому, что процесс, который обычно занимает день или два из‑за ручной настройки контейнеров и inference‑сервера, в примере Kasten сократился до автоматизированного «нулевого» лага, а основной выигрыш автор подчёркивает не в скорости, а в доступности развёртывания.

Процесс, описанный в посте, свёлся к трём ключевым шагам. Сначала команда добавила навык командой: "npx skills add togethercomputer/skills". Затем запустили сессию Goose и передали одно предложение‑промпт: "I want to deploy this model on togethers dedicated containers https: //huggingface.co/netflix/void-model". Агент автоматически извлёк метаданные модели, подобрал конфигурацию inference‑сервера и сгенерировал необходимые файлы контейнера, устранив вручную повторяющиеся шаги и подбор специфичных параметров для архитектуры модели.

Результатом стал полноценный репозиторий с рабочим набором файлов для деплоя — blainekasten/together — void-model-container (ссылка указана в исходном посте). В выводе агент сформировал готовую к запуску конфигурацию контейнера и манифесты для DCI, что убирает необходимость глубокой ручной настройки серверов инференса или тонкой настройки контейнеризации под конкретную модельную архитектуру. Kasten отмечает, что агенты способны «заполнить» пробелы в навыках контейнеризации и настройки окружения, позволяя разработчикам описать цель и получить рабочую систему без погружения в детали.

После деплоя модель доступна для запуска инференса через Together CLI. В качестве примера команду для отправки задания автор привёл в точности: "tg beta jig submit --watch --payload '{\"video_url\": \"https: //github.com/Netflix/void-model/raw/refs/heads/main/sample/lime/input_video.mp4\", \"quadmask_url\": \"https: //github.com/Netflix/void-model/raw/refs/heads/main/sample/lime/quadmask_0.mp4\", \"prompt\": \"Empty park bench with fallen leaves on the ground\", \"use_pass2\": false}'". В примере модель удаляет объекты из видео вместе с вызванными ими физическими взаимодействиями, а инференс выполняется асинхронно.

Асинхронный ответ сервиса возвращает метаданные запроса и статус исполнения; в примере ответа присутствуют поля: "{\"model\": \"void-byoc\", \"request_id\": \"019dc0f3 — 3c73-7a3f-b4b6-87ad06091180\", \"status\": \"running\", \"claimed_at\": \"2026 — 04-24T19:24:19.447457Z\", \"created_at\": \"2026 — 04-24T19:24:19.444567Z\", \"done_at\": null, \"info\": null, \"inputs\": {...}}". Для инженеров это означает: готовый репозиторий, CLI‑инструменты и предсказуемая схема запрос/ответ, пригодная для интеграции в существующие пайплайны и автоматизации рабочих процессов.

Источники

Together AI Blog · 5/8/2026

Ответы (0)

Пока нет ответов в этой теме.