
Лауреат Тьюринговской премии Ричард Саттон утверждает, что обычные генеративные модели способны порождать варианты, но лишены надёжного автоматического механизма оценки и отбора, поэтому сами по себе они не заменят процесс научного открытия.
Лауреат Тьюринговской премии Ричард Саттон прямо заявляет: у «обычных» генеративных моделей отсутствует встроенный механизм проверки, необходимый для научного открытия. Модели генерируют множество вариантов, но без надёжной формализуемой оценки полезной новизны этот поток остаётся хаотичным и не приводит к устойчивому прогрессу — следовательно, роль таких моделей в самостоятельном научном поиске ограничена. Это важно для исследователей и разработчиков: без добавленных средств проверки генерация не превращается в систематический поиск новых истин.
Саттон указывает на структурный пробел: большие языковые, графические и видео‑модели обучаются на огромных наборах примеров и в основном воспроизводят то, что уже встречалось в этих данных. Когда результаты оказываются полезными или «хорошими», это часто связано с качеством исходного материала; когда выходы действительно новы, их ценность обычно не фиксируется и такие явления принято называть «галлюцинациями». Он придерживается иллюстративной шутки исследователей: «Работа и нова, и хороша. К сожалению, хорошие части не новы, а новые части не хороши», — чтобы подчеркнуть разрыв между генерацией и верификацией.
По определению Саттона научное открытие — это цикл из трёх шагов: вариация (порождается множество гипотез), оценка (проверка гипотез на предмет корректности или полезности) и селективное сохранение (утверждение работающих решений). Генеративные модели, по его словам, в основном обеспечивают вариацию. Оценка может выполняться людьми, но только формализуемая обратная связь — та, которую можно автоматически применять и измерять — превращает случайные варианты в целенаправленный поиск и обеспечивает накопление знаний. В качестве примеров систем, где такой цикл реализован, Саттон называет AlphaGo (включая знаменитый ход 37), AlphaZero с его отличительным стилем, AlphaFold для предсказания структуры белков, проекты верификации математических доказательств типа AlphaProof, инструменты для программирования вроде Claude Code и симулируемые гоночные агенты GT — Sophy.
выигрыш в игре, корректность доказательства или прохождение тестов — то есть существует объективный критерий успеха, который позволяет автоматически отбирать лучшие решения. Саттон не отрицает полезность генеративного ИИ в задачах, где требование новизны невысоко: суммаризация, ассистирование, развлечение и автоматизация рутинных офисных операций остаются подходящими областями применения. По его словам, имитация может быть ценна, если она дешевле, быстрее, компактнее, проще настраивается или легче воспроизводится, чем оригинал. Практическое следствие — интеграция механизмов оценки: поиск, верификаторы, инструментальные тесты, обучение с подкреплением и формальные проверители.
Источники
Ответы (0)
Пока нет ответов в этой теме.