Aivizor
Aivizor
СкиныКреативыСообщество
Назад
  1. Сообщество
  2. /
  3. Other AI

xAI добавила Custom Voices для создания голосов из минуты записи

Новость
Н
Наталья Тихонова
Редактор общего направления

5/4/2026, 6:02:50 AM

xAI добавила Custom Voices для создания голосов из минуты записи

xAI предложила разработчикам Custom Voices: создание рабочей модели голоса на основе примерно минуты естественной речи через консоль, готовой менее чем за две минуты и сразу подключаемой к Text‑to‑Speech и голосовым агентам.

xAI представила Custom Voices — инструмент, который преобразует примерно минуту записи в готовую модель голоса и делает её доступной для синтеза речи и голосовых агентов менее чем за две минуты. Это сокращает время от первого захвата образца до рабочего голосового сервиса и упрощает прототипирование для разработчиков и компаний, желающих быстро добавить озвучку или голосовые интерфейсы в продукты. Сбор голоса в консоли xAI организован как двухэтапная верификация: пользователь в реальном времени читает контрольную фразу, затем система сравнивает голосовые характеристики двух записей, чтобы подтвердить, что говорит тот же человек. По заявлению компании, такая процедура препятствует клонированию существующих записей или использованию голосов других людей — шаг, на котором xAI делает акцент при описании безопасности функции.

В интерфейсе появилась «Voice Library» с более чем 80 предустановленными голосами на 28 языках; xAI указывает, что использование клонированных голосов не предполагает дополнительной платы. Наличие библиотеки даёт разработчикам готовые варианты озвучки, а параллельно позволяет создавать персонализированные голоса для конкретных сценариев без отдельной тарификации за копии. Custom Voices опирается на недавно запущенные Grok Speech API для преобразования речи в текст и синтеза, а также на голосовую модель «Grok Voice Think Fast 1.0». xAI отмечает, что эта голосовая модель уже применяется в обслуживании и продажах Starlink, что, по словам компании, демонстрирует прикладную направленность технологии и варианты её интеграции в коммерческие сервисы.

Для разработчиков и предприятий сочетание быстрой сборки модели, её моментальной доступности через API синтеза речи и отсутствия дополнительной платы за клонированные голосовые образы должно уменьшить барьер внедрения голосовых функций. В практическом плане Custom Voices предлагает ускоренное прототипирование персонализированных голосовых ассистентов, IVR‑систем и контента с озвучкой благодаря прямому подключению к экосистеме Grok Speech и готовым голосовым библиотекам. Информация основана на материале The Decoder AI (автор Matthias Bastian), опубликованном 2 мая 2026 года. Исходная заметка указывает URL источника и цитирует заявления xAI о скорости сборки модели, двухэтапной верификации, наличии Voice Library и привязке функции к экосистеме Grok Speech и «Grok Voice Think Fast 1.0».

Источники

  1. The Decoder AI · 5/2/2026
2
0
0

Ответы (0)

Пока нет ответов в этой теме.

9:41