
Компания DeepL, известная своими инструментами перевода текста, представила новый пакет технологий для голосового перевода, открывающий новые возможности для работы и общения.
Компания DeepL, лидер в области текстового перевода, анонсировала новый комплект технологий, позволяющий переводить речь в реальном времени. Этот продукт нацелен на использование в разных сферах, включая встречи и веб-беседы, а также групповые разговоры сотрудников через специальные приложения.
Генеральный директор DeepL, Ярек Кутыловски, подчеркнул, что переход к голосовому переводу был логичным шагом после длительной работы с текстами. 'Мы достигли больших успехов в переводе текстов и документов, но на рынке не хватает качественного решения для перевода речи в реальном времени', — отметил он в интервью TechCrunch.
При разработке продукта компания столкнулась с задачей минимизации задержки между речью и воспроизведением переведенного аудио, сохраняя при этом высокую точность перевода. DeepL также анонсировала плагины для платформ Zoom и Microsoft Teams, которые обеспечат пользователей реальным переводом во время общения и отобразят переведенный текст на экране.
На данный момент технология находится на этапе предварительного доступа, и DeepL приглашает организации записаться для участия. Кроме того, разработан продукт, который позволяет пользователям участвовать в мобильных и веб-беседах как очно, так и удаленно. Система DeepL адаптируется к специализированной терминологии, что особенно важно для поддержки компаний с узкоспециализированным лексиконом. Кутыловски отмечает, что внедрение ИИ изменит представление о службе поддержки клиентов, позволяя предоставлять поддержку на языках, где нехватка квалифицированного персонала является проблемой.
Хотя DeepL контролирует весь процесс голосового перевода, текущая версия сначала переводит речь в текст, затем применяет перевод и возвращает результаты в виде аудио. В будущем компания планирует создать модель полного голосового перевода, устраняющую текстовый этап.
DeepL конкурирует с рядом хорошо профинансированных стартапов в смежных областях, такими как Sanas, использующий ИИ для модификации акцентов, Camb.AI, предлагающий решения для медиаиндустрии, и Palabra, разрабатывающий движок реального времени для перевода речи с сохранением оригинального голоса.
Источники
Ответы (0)
Пока нет ответов в этой теме.