Anthropic frena su IA Mythos: puede hackear el 83% del software

El modelo encuentra miles de vulnerabilidades en cada sistema operativo y navegador. Un consorcio de grandes tecnológicas intenta usarlo como escudo defensivo.

Anthropic ha tomado una decisión sin precedentes en el sector de la inteligencia artificial: retener su modelo más avanzado, Claude Mythos Preview, y no ponerlo a disposición del público. El motivo es tan simple como alarmante. La compañía anunció que retiraría su último modelo de uso general por sus capacidades de descubrimiento de vulnerabilidades, que podrían causar daños significativos en manos equivocadas. No es un ejercicio de precaución teórica: Mythos Preview reprodujo vulnerabilidades y creó pruebas de concepto para explotarlas en el primer intento en el 83,1% de los casos.

La magnitud del hallazgo supera todo lo visto hasta ahora. Según Anthropic, la herramienta ha descubierto miles de puntos débiles en «todos los principales sistemas operativos y navegadores web». Entre los ejemplos más llamativos, Mythos Preview localizó una vulnerabilidad de 27 años de antigüedad en OpenBSD, un sistema operativo considerado uno de los proyectos de código abierto más endurecidos en materia de seguridad y presente en numerosos cortafuegos, routers y servidores de alta seguridad. El modelo no solo detecta fallos: puede encontrar «decenas de miles de vulnerabilidades» que incluso el cazador de errores más avanzado tendría dificultades para hallar, y además escribe los exploits para aprovecharlas.

Qué hace a Mythos diferente de todo lo anterior

Lo que distingue a Mythos de modelos anteriores no es solo la cantidad de vulnerabilidades detectadas, sino la sofisticación del ataque resultante. El modelo no se limita a encontrar fallos de forma aislada, sino que los encadena en exploits complejos que pueden convertirse en herramientas de hacking devastadoras. En una prueba documentada por Anthropic en su blog técnico, Mythos Preview desarrolló de forma autónoma un exploit para navegadores web que encadenó cuatro vulnerabilidades para escapar tanto del renderizador como de los sandboxes del sistema operativo. Otro test reveló algo aún más inquietante: el modelo resolvió una simulación de ataque a una red corporativa que a un experto humano le habría llevado más de diez horas, y también logró escapar de un ordenador de prueba seguro siguiendo instrucciones de un investigador, lo que indica una capacidad «potencialmente peligrosa» para saltarse sus propias salvaguardas.

Lo más significativo, según los propios ingenieros de Anthropic, es que nadie programó explícitamente estas capacidades. No entrenaron a Mythos Preview para tener estas habilidades: emergieron como consecuencia de mejoras generales en código, razonamiento y autonomía. Las mismas mejoras que hacen al modelo más eficaz reparando vulnerabilidades también lo hacen más eficaz explotándolas. En cifras concretas, su predecesor, Opus 4.6, desarrolló solo dos exploits funcionales en varios cientos de intentos sobre el motor JavaScript de Firefox; Mythos Preview desarrolló 181 exploits funcionales y logró control de registros en 29 casos adicionales.

Project Glasswing: rivales históricos, frente unido

Frente a este escenario, Anthropic ha optado por una estrategia que combina contención y defensa proactiva. La compañía está distribuyendo Mythos Preview a más de 40 organizaciones para que escaneen y protejan su propio código, y once de ellas —Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, Nvidia y Palo Alto Networks— participan en una nueva iniciativa llamada Project Glasswing. Que Apple y Google o Microsoft y Amazon trabajen juntos bajo el mismo paraguas de seguridad es, en sí mismo, una señal de la gravedad percibida.

Project Glasswing tiene como objetivo ayudar a las empresas clave a reforzar sus defensas antes de que los hackers obtengan acceso a Mythos o a modelos similares. Para financiar el esfuerzo, Anthropic aportará hasta 100 millones de dólares en créditos de uso para las empresas que prueben Mythos Preview, y cuatro millones de dólares para organizaciones de seguridad de código abierto, incluidas OpenSSF, Alpha-Omega y la Apache Software Foundation. El modelo estará accesible a través de Claude API, Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry, lo que indica la magnitud del ecosistema involucrado.

La brecha que la IA no puede cerrar sola

El problema de fondo que Mythos ha sacado a la luz va más allá de sus propias capacidades: la velocidad de descubrimiento de fallos supera con creces la velocidad a la que las organizaciones pueden parchearlos. Más del 99% de las vulnerabilidades encontradas aún no han sido parcheadas, lo que hace irresponsable revelar los detalles de forma pública. Según recoge Fortune, la realidad incómoda es que la IA facilita encontrar vulnerabilidades mucho más rápido de lo que es posible corregirlas, y al menos durante el próximo año los defensores se encuentran en una carrera para la que todavía no están equipados.

La alarma ha llegado a los niveles más altos de la política económica. El secretario del Tesoro de EE. UU., Scott Bessent, y el presidente de la Reserva Federal, Jerome Powell, se reunieron con los principales CEOs de la banca en una reunión a puerta cerrada para abordar Mythos y otros riesgos emergentes de ciberseguridad derivados de la IA. El CEO de JPMorgan, Jamie Dimon, sintetizó el dilema en su llamada de resultados: las herramientas de IA podrían eventualmente ayudar a las compañías a defenderse de los ciberataques, pero de momento las están haciendo más vulnerables.

El horizonte temporal que maneja Anthropic es estrecho y apremiante. Logan Graham, responsable de investigación cibernética ofensiva en Anthropic, señala que aunque Mythos nunca llegara a ser público, espera que competidores —incluidos los de China— lancen modelos con capacidades comparables en los próximos meses. «Deberíamos planificar para un mundo donde, en seis a doce meses, estas capacidades puedan estar ampliamente distribuidas», advirtió. La tormenta, como describen algunos expertos, no está llegando. Ya está aquí.

El Diario Joven

Anthropic frena su IA Mythos: puede hackear el 83% del software

Qué hace a Mythos diferente de todo lo anterior

Project Glasswing: rivales históricos, frente unido

La brecha que la IA no puede cerrar sola

También te puede interesar

Hackers de Corea del Norte atacan empresas europeas de drones

El BCE exige a la banca reforzar la seguridad ante riesgos de la IA

Empresas españolas potencian servicios con ChatGPT