Исследователи Университета Уайкато под руководством Тэ Така Кигана и его тогдашнего магистранта Кингсли Энга создали высокофидельный синтетический голос для диалекта те‑рео маори Waikato — Maniapoto, при этом модель и все использованные аудиоматериалы официально остаются в собственности говорящих этого диалекта. В проекте в качестве «человеческого» образца и наставницы языка участвовала переводчица и языковая наставница Нгаринги Катипа. после очистки и обработки итоговый объём составил 7 часов 45 минут аудиозаписей. Это решение закрепляет за сообществом контроль над цифровым представлением языка и задаёт прецедент суверенного управления данными.
Авторы проекта отмечают, что современные крупные языковые сервисы — включая ChatGPT, Claude и Perplexity — уже генерируют тексты на те‑рео маори на основе материалов, собранных из маорийских сообществ и академических источников, часто без согласия носителей. Тэ Така Киган подчёркивает, что такие данные нередко обрабатываются за пределами Новой Зеландии, и сообщества не контролируют ни итоговые модели, ни передачу своих знаний. длина гласных критична для различения значений (например, слова keke, kēkē и kekē отличаются только длительностью гласной), а диграфы вроде «wh» обычно произносятся как «f». Кроме того язык остаётся низкоресурсным: в цифровом виде доступно мало текстов, наборов данных и записанной речи, поэтому стандартные подходы к синтезу речи, ориентированные на английский, дают значимые ошибки.

Исходя из этого команда сделала ставку на локальный корпус, диалектную специфику и тщательно подобранные фонетические единицы, чтобы сохранить просодию и особенности произношения Waikato — Maniapoto. Авторы указывают, что большинство существующих систем синтеза речи создаются для английского и требуют значительной адаптации для маорийских форм и интонации; именно локальный, диалектно ориентированный подход, по их мнению, лучше сохраняет языковую идентичность и связь с конкретным местом. Проект авторы представляют как пример «суверенных цифровых систем», где права на данные и выводы модели остаются у сообщества. Для инженеров и разработчиков голосовых решений они выводят конкретные рекомендации: добиваться явного согласия носителей, собирать диалектно‑ориентированные корпусные данные, учитывать фонетику и просодию языка и оформлять юридический контроль над моделью и исходными записями.
Источники
Ответы (0)
Пока нет ответов в этой теме.