Anthropic frena su IA por ser demasiado hábil hackeando

Mythos Preview encuentra miles de vulnerabilidades en todos los sistemas operativos y navegadores, y Anthropic la restringe por su riesgo sin precedentes.

El 7 de abril de 2026, Anthropic hizo algo que ninguna gran compañía de IA había hecho en casi siete años: retener un modelo propio por considerarlo demasiado peligroso para el público. <cite index="4-1">La empresa anunció que no publicaría su último modelo, Mythos Preview, alegando unas capacidades de descubrimiento de vulnerabilidades sin precedentes que podrían causar daños significativos en las manos equivocadas.</cite> La decisión sacudió al sector tecnológico y abrió un debate urgente sobre el futuro de la ciberseguridad en la era de la inteligencia artificial.

<cite index="14-15">Mythos Preview es un modelo de propósito general, todavía sin lanzar al público, que revela un hecho contundente: los modelos de IA han alcanzado un nivel de capacidad de programación que les permite superar a todos los humanos, salvo a los más hábiles, a la hora de encontrar y explotar vulnerabilidades de software.</cite> No es un modelo de nicho entrenado específicamente para hackear. <cite index="8-14">Anthropic aclaró que Mythos Preview es un modelo de propósito general y que sus capacidades cibernéticas mejoradas son consecuencia de sus habilidades avanzadas de codificación y razonamiento.</cite>

Lo que Mythos es capaz de hacer

<cite index="5-15">En las últimas semanas, Anthropic usó Claude Mythos Preview para identificar miles de vulnerabilidades de día cero —es decir, fallos previamente desconocidos para los propios desarrolladores del software— muchas de ellas críticas, en todos los principales sistemas operativos y navegadores web, además de en una variedad de otros programas importantes.</cite> Los ejemplos concretos son escalofriantes: <cite index="1-2">el modelo encontró una vulnerabilidad de 16 años en FFmpeg, un software de manejo de audio y vídeo ampliamente utilizado pero poco conocido.</cite> <cite index="2-1">En otra prueba, Mythos Preview detectó un fallo de 27 años en OpenBSD, un sistema operativo de código abierto, que habría permitido a hackers hacer caer de forma remota cualquier máquina que lo ejecutase.</cite>

Pero lo más inquietante no es solo encontrar los fallos, sino lo que el modelo hace con ellos. <cite index="6-1,6-2">Logan Graham, responsable de investigación cibernética ofensiva en Anthropic, indicó que Mythos Preview era suficientemente avanzado no solo para identificar vulnerabilidades no descubiertas, sino también para convertirlas en armas. El modelo puede ejecutar de forma autónoma tareas de hackeo complejas y efectivas: identificar múltiples vulnerabilidades no divulgadas, escribir código para explotarlas y encadenarlas para penetrar software complejo.</cite> Según el blog técnico del equipo de Anthropic, <cite index="16-7,16-8">personas sin formación en seguridad también pueden usar Mythos Preview para encontrar y explotar vulnerabilidades sofisticadas. Ingenieros de Anthropic sin formación formal en ciberseguridad le pidieron al modelo que buscara vulnerabilidades de ejecución remota de código durante la noche, y a la mañana siguiente se encontraron con un exploit completo y funcional.</cite>

<cite index="1-6">Anthropic reconoció que más del 99% de las vulnerabilidades encontradas siguen sin divulgarse porque todavía no han sido parcheadas.</cite> Una cifra que por sí sola explica el vértigo que rodea este lanzamiento.

La respuesta: el Proyecto Glasswing

En lugar de lanzar Mythos al mercado, Anthropic ha diseñado una estrategia de acceso controlado. <cite index="8-9,8-10">Microsoft, Amazon, Apple, CrowdStrike, Palo Alto Networks y otras cuarenta empresas podrán usar el modelo para labores de seguridad defensiva, en el marco de una nueva iniciativa de ciberseguridad llamada Proyecto Glasswing.</cite> <cite index="2-11">Anthropic ha comprometido hasta 100 millones de dólares en créditos de uso para las empresas que están probando Mythos Preview, y 4 millones adicionales para organizaciones de seguridad de código abierto, incluyendo OpenSSF, Alpha-Omega y la Apache Software Foundation.</cite>

El nombre del proyecto no es casual. <cite index="8-6">Los empleados de Anthropic eligieron el nombre Glasswing —en referencia a una mariposa transparente— como metáfora de las vulnerabilidades de software, que son "relativamente invisibles".</cite> La idea de fondo es que los defensores puedan usar el modelo antes de que modelos similares estén al alcance de actores maliciosos. <cite index="2-9">"Vendrán modelos más potentes, de nosotros y de otros, y por eso necesitamos un plan para responder a esto", declaró el CEO de Anthropic, Dario Amodei, en un vídeo publicado junto al anuncio.</cite>

No es un riesgo futuro: ya está pasando

El anuncio de Mythos llega en un contexto en el que el abuso de la IA para ciberataques ya no es hipotético. En septiembre de 2025, <cite index="12-18,12-19">Anthropic detectó una sofisticada operación de espionaje cibernético que, según la empresa, fue llevada a cabo con alta confianza por un grupo patrocinado por el Estado chino, al que han denominado GTG-1002.</cite> <cite index="11-17">En conjunto, el actor de amenaza fue capaz de usar la IA para ejecutar entre el 80 y el 90% de la campaña, con intervención humana requerida solo de forma esporádica.</cite> Según el informe completo de Anthropic sobre ese ataque, la IA operaba a una velocidad de ataque que habría sido imposible de igualar para un equipo humano de hackers.

Más allá de los estados-nación, <cite index="3-14">modelos como Mythos podrían hacer considerablemente más fácil que incluso personas con escasos conocimientos técnicos lleven a cabo ciberataques sofisticados y devastadores.</cite> <cite index="18-13">La gravedad de la situación llegó hasta los más altos niveles financieros: el secretario del Tesoro Scott Bessent y el presidente de la Reserva Federal Jerome Powell se reunieron con los principales CEO de la banca en un encuentro a puerta cerrada para hablar de Mythos y otros riesgos emergentes de ciberseguridad relacionados con la IA.</cite>

Un debate abierto sobre el control y los límites

No todos en el sector comparten el mismo nivel de alarma ante las capacidades de Mythos. <cite index="3-10,3-11">La razón del escepticismo de algunos investigadores no resulta precisamente tranquilizadora: afirman que gran parte de lo que puede hacer Mythos ya sería posible con modelos más pequeños, baratos y de acceso abierto. Investigaciones recientes de la firma de seguridad en IA AISLE sugieren que varias de las vulnerabilidades que Anthropic destacó en su anuncio podrían haber sido detectadas por modelos de código abierto que cualquiera puede descargar y ejecutar gratis.</cite>

Hay también un debate de fondo sobre quién decide. <cite index="3-16,3-17">La decisión de Anthropic de limitar la distribución de Mythos también concentra un poder inusual en manos de una sola empresa. Aunque Anthropic afirma estar consultando con el gobierno estadounidense sobre las capacidades del modelo, en la práctica es la compañía quien decide quién tiene acceso a una de las capacidades cibernéticas más avanzadas jamás desarrolladas.</cite>

<cite index="2-5">Según el propio Graham, solo harán falta entre seis y dieciocho meses para que otras empresas de IA lancen modelos con capacidades similares a las de Mythos Preview.</cite> La ventana para que los defensores se adelanten a los atacantes es estrecha. <cite index="14-22,14-23">El trabajo de proteger la infraestructura cibernética mundial podría llevar años; las capacidades de la IA de vanguardia probablemente avanzarán sustancialmente en tan solo los próximos meses. Para que los defensores lleven la delantera, hay que actuar ahora.</cite>

El Diario Joven

Anthropic frena su IA por ser demasiado hábil hackeando

Lo que Mythos es capaz de hacer

La respuesta: el Proyecto Glasswing

No es un riesgo futuro: ya está pasando

Un debate abierto sobre el control y los límites

También te puede interesar

BofA advierte sobre exceso de optimismo en inversores globales

Panza Capital advierte de burbuja en IA y apuesta por constructoras sólidas

Un sector concentra el 40% del crecimiento esperado en beneficios en EEUU