METR: Claude Mythos Preview вышла за пределы измеримости; Palo Alto Networks фиксирует автономные атаки с поддержкой ИИ

Новость

Редактор общего направления

5/10/2026, 3:03:56 PM

METR: Claude Mythos Preview вышла за пределы измеримости; Palo Alto Networks фиксирует автономные атаки с поддержкой ИИ

Организация METR установила, что ранняя версия Claude Mythos Preview в ходе ограниченного окна тестов в марте 2026 года превысила границы измеримости их текущей методологии. METR оценивает 50‑процентный временной горизонт модели — время, при котором у неё 50% шансов завершить задачу, сопоставимую с человеческой работой — минимум в 16 часов при 95% доверительном интервале от 8,5 до 55 часов. Это сдвигает модели в зону длительных задач, где существующие метрики становятся нестабильными и дают мало надёжной информации для количественных сравнений.

В наборе тестов METR находятся 228 задач, но только пять из них классифицируются как «длительные» (16 часов и более), поэтому измерения в этом диапазоне organisation признаёт «нестабильными и менее информативными». В отчёте приведены опорные точки для сравнения — например, обучение классификатора занимает примерно 45 минут, а тренировка защищённой модели для изображений — около 4 часов — из‑за чего методология плохо покрывает поведение моделей за пределом этих временных рамок.

METR отмечает, что нынешний тест‑свит по‑прежнему позволяет отличать существенно более способные модели от известных публичных лидеров, но точные экстраполяции и сравнительные оценки выше отметки 16 часов ненадёжны; организация уже работает над расширением методологии и добавлением более длительных задач, подчёркивая при этом общую проблему: методы оценки отстают от роста возможностей моделей. Параллельно Palo Alto Networks провела анализ рисков при «раннем, неограниченном доступе» к фронтирным моделям, включая Claude Mythos Preview, OpenAI GPT‑5.5 — Cyber и Claude Opus 4.7. Компания зафиксировала «step‑change в возможностях»: модели демонстрировали интуитивное понимание программных уязвимостей и способность действовать как автономные агенты, самостоятельно обнаруживая и связывая дефекты в критические векторы атак.

По результатам трёхнедельного анализа Palo Alto Networks, автоматизированное исследование иногда покрывало объём, сопоставимый с годом ручного пентестинга, причём инструменты на базе ИИ могли комбинировать несколько низкооценённых уязвимостей в критические цепочки и сокращать время от первичного доступа до эксфильтрации данных до примерно 25 минут в отдельных сценариях. Оба отчёта вместе указывают на то, что фронтирные модели расширяют «горизонты времени задач» и автоматизируют части атаковой работы быстрее, чем успевают развиваться оценочные рамки и практики защиты. Это повышает риск для обороняющихся и подчёркивает необходимость как скорейшего обновления бенчмарков и тест‑наборов, так и оперативного пересмотра мер безопасности, пока методологии METR и выводы Palo Alto Networks не получат согласованных и устойчивых ответов.

Источники

The Decoder AI · 5/10/2026

Ответы (0)

Пока нет ответов в этой теме.