OpenAI lanza GPT-5.5, su modelo más potente hasta la fecha

El nuevo modelo supera a su predecesor en programación, razonamiento y tareas autónomas, aunque llega con un precio más elevado.

OpenAI ha lanzado GPT-5.5, el modelo de inteligencia artificial más avanzado de la compañía hasta la fecha. Disponible desde hoy para usuarios de los planes Plus, Pro, Business y Enterprise —tanto en ChatGPT como en Codex—, el nuevo modelo promete resolver tareas complejas de forma más autónoma, con mayor precisión y usando menos tokens que su antecesor, GPT-5.4. El precio sube, pero la compañía defiende que la eficiencia compensa el incremento para la mayoría de los casos de uso.

La característica más destacada de GPT-5.5 es su capacidad para gestionar flujos de trabajo de varios pasos sin intervención constante del usuario. Según la propia OpenAI en su publicación oficial, el modelo puede recibir una tarea desordenada y descomponerla: planifica, selecciona herramientas, revisa su propio trabajo y sigue avanzando aunque encuentre ambigüedades en el camino. No se limita a responder preguntas; actúa más como un agente que completa procesos enteros.

Los números que respaldan el salto

En el plano técnico, los benchmarks publicados por OpenAI sitúan a GPT-5.5 claramente por encima de su predecesor. En Terminal-Bench 2.0, una prueba que evalúa flujos de trabajo complejos en la línea de comandos, el modelo alcanza un 82,7%. En SWE-Bench Pro, que mide la resolución de problemas reales extraídos de repositorios de GitHub, logra un 58,6%. Y en Expert-SWE, una evaluación interna en la que las tareas propuestas tienen una duración media estimada de 20 horas para un desarrollador humano, GPT-5.5 también supera a GPT-5.4, y lo hace consumiendo menos tokens para llegar al mismo resultado.

Otros indicadores refuerzan la imagen de un modelo más capaz en entornos reales. En GDPval, que evalúa la producción de trabajo de conocimiento bien especificado en 44 ocupaciones distintas, GPT-5.5 obtiene un 84,9%. En OSWorld-Verified, que mide la capacidad de operar entornos informáticos reales de forma autónoma, el modelo llega al 78,7%. Estas cifras sugieren que la mejora no se circunscribe al código, sino que se extiende a tareas propias del trabajo de oficina más general.

Los ingenieros que accedieron al modelo en fases tempranas destacaron especialmente su comprensión de la arquitectura de sistemas. GPT-5.5 no solo identifica el origen de un fallo, sino que determina dónde debe aplicarse la corrección y qué otras partes del código se verían afectadas por ese cambio. Uno de los casos documentados por OpenAI describe cómo un desarrollador pidió al modelo que rediseñara un sistema de comentarios en un editor colaborativo de Markdown y, al volver, encontró una pila de 12 diferencias casi completamente implementada.

Más allá del código: productividad cotidiana

GPT-5.5 no está diseñado exclusivamente para desarrolladores. En Codex, la plataforma de OpenAI orientada a la generación de documentos y hojas de trabajo, el modelo demuestra una capacidad superior a GPT-5.4 para crear presentaciones, analizar información y transformar datos en bruto en material útil, según los usuarios que participaron en el acceso anticipado. El flujo de trabajo es continuo: busca, filtra lo relevante, opera con herramientas y entrega un resultado procesado.

Para los planes Pro, Business y Enterprise en ChatGPT, OpenAI ofrece además una versión denominada GPT-5.5 Pro, orientada a tareas de mayor complejidad. Esta variante promete respuestas más completas, estructuradas y precisas en áreas como el derecho, la educación, el análisis de datos o el trabajo corporativo, donde la profundidad de la respuesta importa tanto como la velocidad.

Seguridad: capacidades altas, controles más estrictos

El lanzamiento también pone sobre la mesa una cuestión que OpenAI no elude: las capacidades de ciberseguridad de GPT-5.5 han sido clasificadas como "Alta" dentro de su Marco de Preparación, el mismo nivel que sus capacidades en los ámbitos biológico y químico. El modelo puede identificar y explotar vulnerabilidades con mayor eficacia que GPT-5.4, aunque no alcanzó el nivel "Crítico" en las evaluaciones previas al lanzamiento.

Para mitigar los riesgos, OpenAI ha desplegado clasificadores más estrictos diseñados para detectar usos de riesgo en el ámbito de la ciberseguridad. La propia compañía reconoce que esta calibración puede resultar restrictiva para algunos usuarios en un primer momento, mientras los sistemas de detección se ajustan. Antes de salir al mercado, el modelo fue sometido a pruebas específicas con expertos externos en ciberseguridad y biología, y OpenAI se compromete a seguir refinando las salvaguardas a medida que aumente la capacidad de los modelos futuros.

Precio y disponibilidad

GPT-5.5 llega con un coste superior al de GPT-5.4. OpenAI no ha concretado públicamente las cifras exactas del incremento, pero argumenta que la mayor eficiencia en el uso de tokens —es decir, que el modelo necesita menos tokens para completar las mismas tareas— compensa la diferencia de precio para la mayoría de los casos de uso habituales.

En Codex, el modelo ofrece una ventana de contexto de 400.000 tokens, lo que lo hace especialmente apto para proyectos de gran escala que requieren mantener mucho contexto activo. Además, incluye un modo Fast que genera tokens 1,5 veces más rápido que el estándar, aunque a un coste 2,5 veces mayor. Esta opción está pensada para escenarios donde la velocidad es prioritaria y el coste es secundario.

El lanzamiento de GPT-5.5 se produce en un momento de intensa competición entre los grandes laboratorios de IA. Google con Gemini y Anthropic con Claude mantienen una carrera paralela por el liderazgo en capacidades de razonamiento y agentes autónomos. OpenAI, con este lanzamiento, refuerza su posición en el segmento profesional y empresarial, donde la capacidad de completar tareas complejas sin supervisión constante se está convirtiendo en el principal criterio de selección.

El Diario Joven

OpenAI lanza GPT-5.5, su modelo más potente hasta la fecha

Los números que respaldan el salto

Más allá del código: productividad cotidiana

Seguridad: capacidades altas, controles más estrictos

Precio y disponibilidad

También te puede interesar

Los 'freelance' mejor pagados son expertos en IA y tecnología avanzada

Los 7 Magníficos enfrentan su primer flujo de caja negativo y alarman al mercado

CaixaBank impulsa la inteligencia artificial con su plan Cosmos hasta 2027