
El 7 de abril de 2026 Anthropic dijo que su modelo Claude Mythos Preview demostró capacidades inesperadas para encontrar y explotar vulnerabilidades a un ritmo inusual.
El 7 de abril de 2026 Anthropic anunció que Claude Mythos Preview mostró habilidades no previstas para localizar y explotar fallas de software, lo que puso en alerta a la comunidad de ciberseguridad. La noticia generó preocupación pública y gubernamental y llevó a algunos a describir el modelo como una amenaza global de ciberseguridad.
En una evaluación controlada, ingenieros con experiencia mínima en seguridad pidieron a Mythos escanear miles de bases de código. El modelo encontró 271 vulnerabilidades en Mozilla Firefox y desarrolló exploits para 181 de ellas. El equipo rojo de Anthropic y el IA Security Institute del Reino Unido informaron además de miles de vulnerabilidades zero‑day en sistemas operativos, navegadores y otras aplicaciones; un informe cita que funcionarios de la NSA quedaron impresionados por la rapidez del análisis.
Ante esos hallazgos, Anthropic dijo que no ofrecería el modelo al público de inmediato y concedió acceso exclusivo a grandes empresas tecnológicas para pruebas, en un proceso denominado 'Project Glasswing'. La compañía justificó la restricción señalando el riesgo de una liberación abierta y la responsabilidad moral de gestionar la divulgación de vulnerabilidades.
Un investigador de ciberseguridad citado en el artículo afirma que, aunque las capacidades de Mythos son notables, no constituyen una ruptura radical: reflejan comportamientos humanos y la fragilidad de los sistemas actuales. La exposición intensifica el debate sobre pruebas controladas, divulgación responsable y la necesidad de reforzar prácticas defensivas frente a IA capaz de automatizar ataques.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.