
После развёртывания генеративных обзоров в Google Search функция AI Overview демонстрирует явные ошибки: неправильный подсчёт букв и искажение написания слов и имён.
Пользователи обнаружили, что новая функция AI Overview в Google Search регулярно ошибается при подсчёте букв внутри слов — от явных орфографических искажений до неправильно указанного количества символов, что ставит под угрозу надёжность генеративных обзоров, встроенных в результаты поиска. Это важно: генеративные ответы теперь становятся частью выдачи, и такие ошибки напрямую влияют на доверие пользователей и точность информации в интерфейсе поиска.
В опубликованных примерах система утверждала, что в слове «Google» содержатся две буквы P, в слове «poop» — ровно одна буква R, а слово «journalism» было разбито как j-o-u-r-n-a-d-i-s-m с якобы двумя буквами D. При запросе фамилии президента AI Overview указала, что в ней одна буква P, но сама вывела написание t-r-p-u-m. Эти и подобные случаи заметили пользователи после недавнего развёртывания генеративных обзоров.
Ошибки возникли в рамках масштабного редизайна сервиса поиска, которому Google делает центральную ставку в своём 29‑летнем продукте. Компания подтвердила в электронном заявлении наличие проблемы: «подсчёт внутри слов долгое время является известной проблемой для LLM, и мы работаем над устранением этой конкретной ошибки». Ранее Google уже устранял другие баги, связанные с генеративными обзорами, но текущие примеры показывают, что точность в мелких деталях остаётся проблемой.
Технически такие ошибки объясняются тем, как устроены большие языковые модели. Современные LLM опираются на архитектуру трансформеров и работают не с буквами как отдельными единицами, а с токенами — кусками текста, которые могут соответствовать целым словам, слогам или отдельным буквам в зависимости от токенизатора. Текст переводится в числовые «кодировки», а не обрабатывается посимвольно, поэтому модели затруднительно выполнять точный подсчёт символов и сохранять позиционную орфографию.
Исследователь ИИ Маттью Гуздиал из Университета Альберты пояснил, что модель имеет «кодировку» для таких единиц, как слово «the», но не «знает» про отдельные символы T, H, E в человеческом смысле — отсюда ошибочные ответы на задачи, требующие посимвольной точности. Докторская студентка по интерпретируемости LLM Sheridan Feucht добавляет, что вопрос «что такое слово для модели» остаётся неопределённым, и даже улучшенная токенизация вряд ли полностью устранит эффект «chunking».
Эксперты предупреждают о практических последствиях: продуктовым командам и разработчикам не следует полагаться на AI Overview для задач, требующих точного машинного чтения или верификации орфографии без дополнительной валидации. Ошибки усиливают критику интеграции генеративных ответов в результаты поиска и подчёркивают необходимость контрольных слоёв, тестирования на краевых примерах и явной пост‑проверки критичных выводов, пока модели не получат более надёжные механизмы работы с буквами.
Источники
Ответы (0)
Пока нет ответов в этой теме.