
Стартап ComfyUI, предоставляющий креаторам инструменты для контроля над генерацией изображений, видео и аудио с помощью диффузионных моделей на основе нодовых интерфейсов, привлек тридцать миллионов долларов в новом раунде финансирования. В результате этой сделки общая оценка компании достигла полумиллиарда долларов. Ведущим инвестором выступил фонд Craft Ventures, а также в раунде приняли участие другие представители венчурного капитала, включая Pace Capital, Chemistry и TruArrow. Согласно материалу Марины Темкин для издания TechCrunch AI, этот шаг подчеркивает растущий интерес индустрии к профессиональным решениям, которые выходят за рамки простых текстовых запросов к базовым моделям.
История проекта началась относительно недавно — он зародился в 2023 году как инициатива с открытым исходным кодом, появившаяся вскоре после массового внедрения первых диффузионных систем. В то время ранние версии популярных генеративных продуктов, включая алгоритмы Midjourney и DALL-E от OpenAI, были едва функциональными и часто допускали критические ошибки в анатомии объектов, например, регулярно добавляя людям лишние пальцы на руках. Чтобы преодолеть эти ограничения, основатели разработали модульный фреймворк, который позволил авторам получить точный контроль над каждым этапом процесса создания контента.
Генеральный директор и соучредитель ComfyUI Йоланд Ян отмечает, что хотя современные базовые модели продвинулись далеко вперед и больше не добавляют шестой палец, потребность в пошаговой точности только возросла. По его словам, типичные решения на основе текстовых подсказок позволяют достичь желаемого результата лишь на шестьдесят или восемьдесят процентов. Попытка изменить оставшиеся двадцать процентов превращается в непредсказуемый процесс, который руководитель сравнивает с игрой на игровом автомате в казино. Пользователь вынужден заново отправлять запросы, что может привести к совершенно иной итоговой картинке, включая случайную перезапись тех элементов композиции, которые уже были идеальными в предыдущей генерации.
Чтобы избежать этой непредсказуемости, ComfyUI предлагает нодовый рабочий процесс. Инструмент позволяет создателям визуальных эффектов связывать между собой специфические компоненты процесса, обеспечивая полный контроль над качеством итогового материала. Йоланд Ян подчеркивает, что подобную сложную архитектуру изменений невозможно передать через обычное поле для ввода текста в стандартной базовой модели. Такой подход нашел широкий отклик у творческих специалистов: на сегодняшний день стартап заявляет о наличии более четырех миллионов пользователей.
Практическая значимость инструмента подтверждается его глубоким проникновением в различные профессиональные сферы. Платформа активно применяется экспертами для создания визуальных эффектов, профессиональной анимации, разработки рекламных материалов и в промышленном дизайне. В компании заявляют, что их продукт стал настолько необходимой частью инструментария для технических художников, что на профильных досках вакансий студий теперь нередко можно встретить специфические должности, такие как «художник ComfyUI» или «инженер ComfyUI».
Несмотря на то, что фундаментальные модели для создания видео и изображений продолжают непрерывно совершенствоваться, руководство стартапа утверждает, что они все еще далеки от идеала. Йоланд Ян уверен, что в мире, где низкокачественный контент будет заполнять пространство, подход ComfyUI с обязательным участием человека в цикле генерации в конечном итоге завоюет наибольшее внимание аудитории. Развиваться стартапу предстоит в конкурентной среде, где присутствуют и другие игроки, такие как компания Weavy, приобретенная корпорацией Figma в прошлом году.
Источники
Ответы (0)
Пока нет ответов в этой теме.