Anthropic veta su IA Mythos por ser demasiado peligrosa

El modelo encuentra miles de vulnerabilidades críticas en todos los grandes sistemas operativos y lanza Project Glasswing con las Big Tech para defenderse.

El 7 de abril de 2026, Anthropic sacudió al sector tecnológico con un anuncio sin precedentes: su nuevo modelo de inteligencia artificial, Claude Mythos Preview, es tan capaz de encontrar y explotar vulnerabilidades de software que la compañía ha decidido no lanzarlo al público. En su lugar, ha creado Project Glasswing, una alianza de defensa cibernética con más de 40 organizaciones, entre ellas Amazon Web Services, Microsoft, Google, Apple, Nvidia, CrowdStrike y JPMorgan Chase, para intentar parchear los agujeros de seguridad antes de que lo hagan los atacantes.

<cite index="16-16,16-17">Claude Mythos Preview es un modelo frontera de propósito general que, según Anthropic, ha alcanzado un nivel de capacidad tal que supera a casi todos los humanos a la hora de encontrar y explotar vulnerabilidades de software. El modelo ya ha identificado miles de fallos de alta gravedad, incluyendo algunos presentes en todos los grandes sistemas operativos y navegadores web.</cite> No es marketing: los datos publicados por el equipo interno de Anthropic son llamativos.

Lo que Mythos encontró que ningún humano vio

<cite index="10-17">Entre los hallazgos: una vulnerabilidad en OpenBSD, sistema operativo conocido precisamente por su seguridad, que había escapado a la detección durante 27 años; otro fallo en el codificador de vídeo FFmpeg que sobrevivió a cinco millones de pruebas automatizadas previas sin ser descubierto; y varias vulnerabilidades en el kernel de Linux que podían encadenarse para tomar el control completo del equipo.</cite>

<cite index="7-6,7-7">El modelo es descrito como "extremadamente autónomo" y posee capacidades de razonamiento sofisticadas que le otorgan las habilidades de un investigador de seguridad avanzado. Según el jefe del equipo rojo de Anthropic, puede encontrar "decenas de miles de vulnerabilidades" que incluso el mejor cazador de bugs humano tendría dificultades para localizar.</cite> Para calibrar el salto cualitativo: <cite index="3-10,3-11">su predecesor, Opus 4.6, convirtió vulnerabilidades encontradas en el motor JavaScript de Firefox en exploits funcionales apenas dos veces en varios cientos de intentos. Mythos Preview lo consiguió 181 veces en la misma prueba.</cite>

El detalle más inquietante quizá sea este: <cite index="3-14,3-15,3-16">Anthropic no entrenó deliberadamente a Mythos para tener estas capacidades. Surgieron como consecuencia directa de mejoras generales en código, razonamiento y autonomía. Las mismas mejoras que hacen al modelo más eficaz para parchear vulnerabilidades lo hacen igualmente eficaz para explotarlas.</cite>

Project Glasswing: defender antes de que ataquen

La respuesta de Anthropic es lo que han bautizado como Project Glasswing, en referencia a una mariposa de alas transparentes. <cite index="17-2,17-3">La iniciativa se asocia con las organizaciones responsables de la infraestructura de la que dependen miles de millones de personas, y les da ventaja con el modelo Mythos Preview. Los socios fundadores incluyen Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks.</cite>

<cite index="17-5,17-6">El acceso se ha extendido a más de 40 organizaciones adicionales que construyen o mantienen infraestructura crítica de software. Anthropic compromete hasta 100 millones de dólares en créditos de uso y 4 millones en donaciones a organizaciones de seguridad de código abierto.</cite> Parte de ese dinero va a OpenSSF y Alpha-Omega a través de la Linux Foundation, y al Apache Software Foundation, para que los mantenedores de proyectos open source puedan responder a este nuevo escenario.

<cite index="2-17,2-18">Anthropic no tiene planes de hacer Mythos Preview disponible de forma general, pero su objetivo a largo plazo es permitir que los usuarios puedan desplegar modelos de esta clase de forma segura. Para lograrlo, necesitan avanzar en el desarrollo de salvaguardas de ciberseguridad que detecten y bloqueen los outputs más peligrosos del modelo.</cite>

El debate: ¿escudo o teatro de seguridad?

La decisión de Anthropic no ha estado exenta de críticas. <cite index="6-4">A raíz del anuncio sobre Mythos Preview, el secretario del Tesoro estadounidense Scott Bessent convocó una reunión con las principales instituciones financieras para hablar de "los rápidos avances que están teniendo lugar en la IA".</cite> La alarma llega hasta el Congreso.

Pero los expertos están divididos. <cite index="5-10,5-11">David Lindner, director de seguridad de la información en Contrast Security, reconoce que Mythos puede ayudar a encontrar multitud de problemas, pero señala que encontrar vulnerabilidades no es el mayor desafío: arreglarlas sí lo es. Además, apunta que más del 99% de los fallos descubiertos por el modelo siguen sin parchear.</cite>

Otros van más allá y cuestionan la exclusividad del hallazgo. <cite index="9-22,9-23">Investigadores de la firma de seguridad AISLE sugieren que varias de las vulnerabilidades destacadas por Anthropic, incluyendo bugs de décadas de antigüedad, podrían haber sido detectadas por modelos de código abierto disponibles gratuitamente. La diferencia metodológica, matizaron, es que ellos ya sabían qué segmentos de código analizar.</cite>

<cite index="6-14,6-15">Logan Graham, responsable de investigación cibernética ofensiva en Anthropic, espera que competidores, incluidos los de China, lancen modelos con capacidades de hacking comparables en los próximos meses. "Deberíamos planificar para un mundo donde, en seis a doce meses, capacidades como estas puedan distribuirse ampliamente, no solo por empresas de Estados Unidos".</cite>

Eso es lo que lo convierte en un asunto que va mucho más allá de Silicon Valley. <cite index="1-9">La infraestructura de software afectada sostiene muchos de los servicios de los que la gente depende cada día, desde la electricidad y el agua hasta las aerolíneas, la banca, el comercio y los hospitales.</cite> Un modelo capaz de encontrar y encadenar vulnerabilidades en todo eso de forma autónoma no es una amenaza abstracta: es una carrera contrarreloj. Y Anthropic acaba de disparar el pistoletazo de salida.

El Diario Joven

Anthropic veta su IA Mythos por ser demasiado peligrosa

Lo que Mythos encontró que ningún humano vio

Project Glasswing: defender antes de que ataquen

El debate: ¿escudo o teatro de seguridad?

También te puede interesar

Claude Opus 4.8: más honesto y más rápido que nunca

La IA transforma las reuniones en el sistema nervioso de la empresa

Spotify impulsa la música generada por IA con acuerdo con Universal