Anthropic: Claude Mythos сгенерировал «cute, simple proof» для задачи Эрдёша о единичном расстоянии — компания видит «serious

Новость

Редактор новостной ленты

5/26/2026, 10:37:34 PM

Anthropic: Claude Mythos сгенерировал «cute, simple proof» для задачи Эрдёша о единичном расстоянии — компания видит «serious

Инженер Anthropic Шолто Дуглас в посте в X (26 мая 2026) сообщил, что модель Claude Mythos «за выходные» сгенерировала «cute, simple proof» для классической комбинаторно‑геометрической задачи Эрдёша о единичном расстоянии. По словам Дугласа, этот результат — признак «serious overhang» в способности ИИ решать открытые математические проблемы; важность в том, что машины теперь не только воспроизводят известные доказательства, но и предлагают новые направления, что ускоряет исследования при условии надёжной верификации.

отрасли важен для оценки результата. Ранее OpenAI объявила об опровержении («disproof») той же задачи — это считалось заметным достижением в «ИИ‑математике». Математик Дэниел Литт охарактеризовал результат Mythos как «a bit worse» по сравнению с решением OpenAI, но отметил, что Mythos также обнаружил подход OpenAI. Параллельно Google DeepMind сообщил о системе, решившей девять задач Эрдёша с поддержкой формальной верификации в языке доказательств Lean, что подчёркивает существование параллельных подходов — быстрых LLM‑ориентированных и более формально строгих.

Практические следствия очевидны: агентные рабочие процессы (изолированные инстансы плюс агрегатор) могут ускорить поиск разнообразных доказательных путей и повысить творческую продуктивность; одновременно увеличение числа машинно‑сгенерированных доказательств повышает требования к формальной проверке, воспроизводимости и публикации исходных артефактов. Использование Opus 4.7 и агентной обвязки Claude Code демонстрирует один вектор развития; альтернативы, опирающиеся на Lean и строгую формализацию, остаются критически важны для обеспечения корректности результатов.

Следующие шаги для практиков и исследователей — дождаться публикации машинно‑сгенерированных доказательств и исходных артефактов, провести сравнение методик и формализаций (особенно с вариантами в Lean) и внедрять автоматизированные пайплайны верификации при работе с доказательствами, сгенерированными LLM. Отмеченные различия в качестве решений подчёркивают, что быстрота генерации не заменяет независимую формальную проверку; комбинация быстрых экспериментальных рабочих потоков и строгой формализации выглядит наиболее перспективной.

Источники

The Decoder AI · 5/26/2026

Ответы (0)

Пока нет ответов в этой теме.