LaDiR: Революция в рассуждениях больших языковых моделей с помощью диффузионных методов

Новость

Редактор новостной ленты

4/29/2026, 4:02:36 AM

LaDiR: Революция в рассуждениях больших языковых моделей с помощью диффузионных методов

На ежегодной конференции ICLR 2026 года в апреле команда исследователей, включающая Хаоцяна Канга, Ичже Чжана, Никки Лицзин Куанга, Никласа Маямаки, Навдипа Джайтли, Йи — Эна Ма и Ляньхуэй Циня, представляющих Apple Machine Learning Research и Университет Калифорнии, Сан — Диего, представила инновационный фреймворк под названием LaDiR (Latent Diffusion Reasoner). Это исследование предлагает новый взгляд на улучшение способности больших языковых моделей (LLM) к текстовому рассуждению, преодолевая ограничения существующих методик.

Традиционно большие языковые модели демонстрируют свои способности к рассуждению через генерацию так называемых " цепочек мыслей" (Chain — of-Thought, CoT). Однако присущее LLM авторегрессивное декодирование может ограничивать их возможность целостно пересматривать и уточнять ранее сгенерированные токены. Это ограничение часто приводит к неэффективному поиску разнообразных решений и потенциально менее оптимальным результатам рассуждений. Именно эту фундаментальную проблему стремится решить LaDiR, предлагая новый подход к организации и совершенствованию мыслительного процесса.

LaDiR представляет собой принципиально новый фреймворк, который объединяет выразительность непрерывного латентного представления с мощными возможностями итеративного уточнения, характерными для моделей латентной диффузии. Для достижения этой цели первым шагом является построение структурированного латентного пространства рассуждений. Это пространство создается с использованием вариационного автокодировщика (VAE), который кодирует шаги текстового рассуждения в блоки " токенов мысли". Такой подход позволяет сохранить семантическую информацию и интерпретируемость, одновременно предлагая компактные, но при этом выразительные представления мыслительного процесса.

После формирования латентного пространства LaDiR использует модель латентной диффузии, которая обучается деноизировать блок латентных токенов мысли. Ключевой особенностью этого процесса является применение блочной двунаправленной маски внимания, что позволяет модели охватывать более длительный горизонт рассуждений и выполнять итеративное уточнение с адаптивной вычислительной мощностью во время тестирования. Этот тщательно продуманный механизм обеспечивает эффективную параллельную генерацию разнообразных траекторий рассуждений, что позволяет модели планировать и пересматривать процесс рассуждения целостным образом, в отличие от пошагового, необратимого подхода авторегрессивных моделей.

Эмпирические результаты, полученные в ходе оценок на наборах бенчмарков для математического рассуждения и планирования, продемонстрировали значительные преимущества LaDiR. Фреймворк последовательно улучшает точность, разнообразие и интерпретируемость по сравнению с существующими авторегрессивными методами, а также другими подходами, основанными на диффузии и латентных представлениях. Это свидетельствует о появлении новой парадигмы для текстового рассуждения с использованием латентной диффузии, которая может существенно изменить подходы к созданию и обучению LLM.

Внедрение LaDiR представляет собой значительный прорыв в области обработки естественного языка и искусственного интеллекта. Тогда как традиционные авторегрессивные модели, такие как GPT, обученные на предсказании следующего токена, генерируют текст, сэмплируя один дискретный токен за раз, LaDiR предлагает более гибкий подход. Хотя авторегрессивные модели масштабируемы, их объектная функция принуждает модель принимать окончательное решение на каждом шаге, что препятствует исследованию или размышлению над несколькими правдоподобными продолжениями.

Источники

Apple Machine Learning Research · 4/28/2026

Ответы (0)

Пока нет ответов в этой теме.