
Британское агентство по безопасности ИИ (AISI) дважды сократило оценку времени удвоения киберспособностей — с 8 до 4,7 месяцев — но новые фронтирные модели Anthropic и OpenAI превзошли даже эту ускоренную шкалу в имитационных тестах и независимых оценках.
Anthropic Claude Mythos Preview и OpenAI GPT-5.5 превзошли ожидания Британии по скорости роста киберспособностей ИИ, заставив British AI Safety Institute (AISI) дважды пересмотреть свои прогнозы: время удвоения оценок упало сначала с восьми месяцев, а затем до 4,7 месяца. Это сдвигает горизонты оценки угроз и усложняет привычные методы прогнозирования развития опасных возможностей моделей. В тестовой среде AISI новые фронтирные модели показали качественный скачок. Контрольный чекпоинт Claude Mythos Preview завершал 32‑этапную симуляцию атаки на корпоративную сеть в шести случаях из десяти; предыдущая версия Mythos справлялась только в трёх из десяти. AISI отмечает, что воспроизведение такого сценария человеком‑экспертом занимает порядка 20 часов, что подчёркивает ресурсную эффективность моделей при разработке атак.
Mythos Preview впервые прошёл и симуляцию промышленной системы управления «Cooling Tower» в трёх попытках из десяти — сценарий, который предыдущие модели не преодолевали. Чекпоинт был развёрнут у партнёров AISI, что свидетельствует о раннем промышленном распространении исследовательских версий в тестовых средах и увеличивает вероятность их влияния на реальные операции в ближайшем будущем.
Независимая оценка от оффенсивной security‑команды XBOW подтвердила сильные стороны Mythos Preview в анализе исходного кода: команда из десяти экспертов зафиксировала «значительный прогресс» и «беспрецедентную точность token‑for‑token». По сравнению с Anthropic Opus 4.6 Mythos сократил долю ложных отрицаний на 42%; при доступе к исходникам это снижение достигало 55%. Модель также обнаружила уязвимости в песочнице Chromium V8, где предыдущие версии в основном давали ложные срабатывания.
AISI подчёркивает рыночный контекст: вместе с GPT‑5.5 Mythos Preview «сильно превысили» недавние прогнозы агентства. В заявлении агентства говорится: «направление очевидно: киберспособности быстро развиваются», и уже готовятся более строгие оценки с применением активных защит и усложнённых сценариев, таких как симуляция «The Last Ones», где модели в лучших попытках достигают финальной стадии — полного захвата сети.
Последствия для разработчиков и команд защиты очевидны: резкий скачок делает надёжное прогнозирование менее предсказуемым и требует новых подходов к тестированию и оценке рисков. Глава ред‑тиминга Anthropic Логан Грэм предупреждает: «Within a year, Mythos will probably look quite dumb.» XBOW одновременно указывает важное ограничение: сильные результаты в анализе исходного кода не эквивалентны доступу к реально запущенной системе; практическая оценка риска требует тестов против работающих систем и активных контрмер.
Источники
Ответы (0)
Пока нет ответов в этой теме.