Aivizor
Aivizor
EstilosCreacionesComunidad
Atrás
  1. Comunidad
  2. /
  3. Other AI

Claude Mythos supera simulaciones de ciberataques de la agencia británica y AISI eleva sus previsiones

News
I
Inés Montoya

5/14/2026, 11:53:19 AM

Claude Mythos supera simulaciones de ciberataques de la agencia británica y AISI eleva sus previsiones

La IA Security Institute (AISI) anunció que los modelos de vanguardia Anthropic’s Claude Mythos Preview y OpenAI’s GPT‑5.5 superaron sus escenarios de prueba, lo que motivó una revisión al alza de las proyecciones sobre la velocidad de avance en capacidades cibernéticas. El resultado es significativo porque altera las expectativas usadas por defensores y reguladores para calibrar medidas de seguridad.

En las pruebas, AISI registró que un checkpoint de Mythos Preview completó un ataque simulado de 32 pasos contra una red corporativa en 6 de cada 10 intentos; la agencia calcula que un experto humano necesitaría unas 20 horas para ejecutar ese mismo ataque. El mismo checkpoint resolvió la simulación de control industrial denominada “Cooling Tower” en 3 de 10 intentos, un hito que, según AISI, ningún modelo anterior había logrado superar.

AISI recordó su línea base anterior: en noviembre de 2025 estimó que las capacidades de la IA se duplicaban cada ocho meses; en febrero de 2026 revisó esa cifra a 4,7 meses. La agencia sostiene que Claude Mythos Preview y GPT‑5.5 han “excedido sustancialmente” incluso ese ritmo acelerado. Anthropic, por su parte, desplegó el checkpoint probado a sus socios, y Logan Graham, jefe de red teaming de la compañía, advirtió: “Within a year, Mythos will probably look quite dumb.

Por qué importa: el salto de rendimiento ha saturado los bancos de prueba de AISI y aumenta la incertidumbre sobre la previsibilidad del riesgo cibernético. Esa aceleración complica la proyección fiable de tendencias y plantea nuevos desafíos prácticos para quienes defienden infraestructuras críticas y para los reguladores que usan estas métricas para diseñar políticas de mitigación.

Fuentes

  1. The Decoder AI · 5/14/2026
0
0
0

Respuestas (0)

Aún no hay respuestas en este tema.

9:41