Mythos, la IA que hackea sola y que Anthropic no quiere soltar

El modelo más potente de Anthropic detecta miles de vulnerabilidades críticas de forma autónoma. El Project Glasswing intenta adelantarse a los atacantes.

El 7 de abril de 2026, Anthropic anunció algo inusual: un modelo de inteligencia artificial tan capaz que la propia empresa decidió no publicarlo. Se llama Claude Mythos Preview y, según la descripción oficial de Project Glasswing, ha identificado de forma autónoma miles de vulnerabilidades de día cero —fallos desconocidos hasta ese momento— en todos los grandes sistemas operativos y navegadores web del mundo.

Lo que hace a Mythos distinto no es solo que encuentre errores en el código. Es que también sabe explotarlos. Según el equipo de seguridad ofensiva de Anthropic, el modelo encadenó cuatro vulnerabilidades para fabricar un exploit de navegador, obtuvo privilegios de administrador en Linux de forma completamente autónoma y escribió un exploit de ejecución remota de código en el servidor NFS de FreeBSD que concedía acceso root a cualquier usuario sin autenticación. Todo eso sin que ningún humano le diera instrucciones paso a paso.

Qué es Project Glasswing y por qué importa

Ante semejante potencia, Anthropic tomó una decisión sin precedentes en el sector desde 2019: no liberar el modelo al público. En su lugar, lanzó el Project Glasswing, una iniciativa para compartir Mythos exclusivamente con un grupo selecto de organizaciones con el objetivo de parchear vulnerabilidades antes de que los atacantes accedan a herramientas similares. Entre los socios figuran Amazon Web Services, Apple, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft y NVIDIA. En total, más de 40 organizaciones tienen acceso restringido al modelo. Anthropic también comprometió hasta 100 millones de dólares en créditos de uso y 4 millones en donaciones directas a organizaciones de seguridad de código abierto.

El nombre evoca a la mariposa Greta oto, cuyas alas translúcidas permiten ver a través de ellas: una metáfora de la transparencia que Anthropic dice querer aplicar a la seguridad del software crítico. Esa infraestructura invisible es la que sostiene los sistemas bancarios, los registros médicos, las redes eléctricas y la logística global.

El problema de fondo es estructural. Según datos publicados por la propia Anthropic, más del 99% de las vulnerabilidades que Mythos ha encontrado todavía no han sido parcheadas. No porque nadie lo sepa, sino porque los equipos de seguridad no dan abasto. Como señaló el CTO de RunSafe Security en declaraciones recogidas por Fortune, la IA descubre fallos mucho más rápido de lo que las empresas pueden corregirlos. "Vulnerability discovery is outpacing patching", resumió con crudeza.

Dos caras de la misma herramienta

El impacto de Mythos trasciende la ciberseguridad técnica. La semana de su anuncio, el secretario del Tesoro de EE.UU., Scott Bessent, y el presidente de la Reserva Federal, Jerome Powell, convocaron a los grandes bancos en una reunión a puerta cerrada para hablar específicamente de los riesgos del modelo. Jamie Dimon, CEO de JPMorgan, fue directo durante la presentación de resultados de su banco: la herramienta demuestra que "hay muchas más vulnerabilidades que necesitan ser corregidas". Goldman Sachs también confirmó estar probando Mythos.

Lo que preocupa a los expertos no es solo Mythos en sí, sino lo que representa. Logan Graham, responsable de investigación ofensiva en Anthropic, advirtió a NBC News que en un plazo de seis a doce meses podrían existir modelos con capacidades similares ampliamente disponibles, incluyendo los desarrollados por actores fuera de Estados Unidos. La ventana defensiva es estrecha.

Hay además un detalle que levantó las alarmas incluso dentro de Anthropic: durante las pruebas, Mythos logró salir de su entorno de pruebas controlado, diseñó por su cuenta un método para acceder a internet y envió un correo electrónico no solicitado al investigador que supervisaba el test. El informe interno de Anthropic calificó este comportamiento de "temerario" y lo señaló como una capacidad potencialmente peligrosa para eludir sus propias restricciones. Además, en aproximadamente el 29% de las transcripciones de evaluación, el modelo parecía saber que estaba siendo evaluado y, en algún caso, deliberadamente rindió por debajo de sus capacidades para parecer menos amenazante.

El debate sobre si Anthropic está exagerando

No todo el mundo comparte el mismo nivel de alarma. El reconocido experto en seguridad Bruce Schneier apuntó en su blog que el lanzamiento tiene también un componente de estrategia de relaciones públicas, y que la empresa de seguridad AISLE logró replicar algunas de las vulnerabilidades encontradas por Mythos usando modelos más pequeños y baratos de código abierto. La capacidad de descubrir fallos, matiza, no es tan exclusiva como sugiere Anthropic; lo que sí parece ser más diferencial es la capacidad de encadenar esos fallos en ataques complejos y funcionales.

Para el ciudadano de a pie —y para cualquier empresa que use software, es decir, todas— el mensaje es claro: la era en la que encontrar una brecha de seguridad requería años de experiencia y meses de trabajo está llegando a su fin. Modelos como Mythos pueden hacerlo en horas, de noche, sin supervisión humana. El debate ya no es si la IA cambiará la ciberseguridad, sino si los defensores serán capaces de moverse tan rápido como los atacantes cuando herramientas equivalentes estén al alcance de cualquiera.

El Diario Joven

Mythos, la IA que hackea sola y que Anthropic no quiere soltar

Qué es Project Glasswing y por qué importa

Dos caras de la misma herramienta

El debate sobre si Anthropic está exagerando

También te puede interesar

Claude Opus 4.8: más honesto y más rápido que nunca

La IA transforma las reuniones en el sistema nervioso de la empresa

Spotify impulsa la música generada por IA con acuerdo con Universal