Gadgetsven: GPT-5.4: la IA de OpenAI que ya puede manejar tu ordenador de forma autónoma

Inteligencia artificial operando ordenadores

OpenAI ha dado un paso importante en la evolución de sus modelos al presentar GPT-5.4, una inteligencia artificial capaz de operar ordenadores de forma prácticamente autónoma. El sistema deja de limitarse al texto y al código, al igual que otros sistemas de IA capaces de escribir artículos, para entrar de lleno en la ejecución de tareas dentro del propio escritorio, moviéndose por aplicaciones como si delante hubiera una persona con teclado y ratón.

La compañía liderada por Sam Altman posiciona GPT-5.4 como su modelo de referencia para el trabajo profesional, en un mercado competitivo donde modelos como Claude también ganan terreno, con un enfoque claro en automatizar flujos de trabajo largos y complejos. En Europa y España, esta nueva generación abre la puerta a agentes de IA que no solo responden a consultas, sino que se integran en el día a día de oficinas, despachos y empresas tecnológicas como un operador digital más.

Un modelo diseñado para controlar el ordenador de manera autónoma

GPT-5.4 controlando aplicaciones de escritorio

La gran novedad de GPT-5.4 es su capacidad para interactuar directamente con el sistema operativo y las aplicaciones sin tener que recurrir a integraciones externas. El modelo puede abrir programas, moverse por menús, rellenar formularios, navegar por páginas web o gestionar archivos utilizando acciones equivalentes a clics de ratón y pulsaciones de teclado.

Hasta ahora, este tipo de control del ordenador dependía de scripts específicos o herramientas de terceros, lo que hacía los flujos de trabajo más frágiles y difíciles de escalar. Con GPT-5.4, el manejo del escritorio se convierte en una función nativa, lo que permite a los agentes completar procesos de principio a fin en ofimática, CRM, gestores de proyectos, plataformas de desarrollo o paneles web corporativos, algo que también persigue la era de la IA agencial impulsada por algunos proveedores.

Para poder sostener este tipo de operaciones, el modelo admite una ventana de contexto de hasta un millón de tokens. En la práctica, esto significa que es capaz de mantener en la memoria de trabajo grandes volúmenes de documentación, múltiples pasos intermedios y cadenas de instrucciones extensas, algo especialmente útil en entornos empresariales europeos donde se manejan contratos, informes técnicos o grandes hojas de cálculo. Este avance encaja con los recientes desarrollos en modelos de razonamiento avanzado que buscan mantener contexto en tareas largas.

Otra pieza clave es la nueva función de búsqueda automática de herramientas. Gracias a ella, GPT-5.4 puede identificar qué aplicación o recurso necesita en cada momento: decidir si debe abrir un editor de código, una base de datos, una hoja de cálculo o un navegador, y combinar varios programas para resolver una misma tarea sin que el usuario tenga que ir guiando cada clic.

Con este enfoque, OpenAI refuerza la idea de agentes de IA que actúan como un “empleado digital” dentro del ecosistema de software de la organización. No se trata solo de contestar a preguntas, sino de ejecutar procesos concretos, respetando fases, validaciones y comprobaciones intermedias, algo especialmente relevante en empresas que operan en España y el resto de Europa bajo marcos regulatorios estrictos.

Mejor razonamiento y más nivel en programación

IA programando y automatizando tareas

Más allá del control del ordenador, GPT-5.4 llega con mejoras notables en razonamiento y capacidades de codificación. OpenAI indica que el modelo supera al especializado anterior, conocido como GPT-5.3-Codez, tanto en precisión como en velocidad para tareas de programación en entornos profesionales.

Esto se traduce en una mayor solvencia a la hora de escribir, revisar y depurar código en distintos lenguajes, además de integrarse mejor en flujos de integración continua, automatización de pruebas o análisis de repositorios. Para equipos de desarrollo y consultoras tecnológicas europeas, la combinación de control de escritorio y competencias de programación permite automatizar desde pequeños scripts internos hasta partes completas de proyectos de software. Además, la relación con la infraestructura y la aceleración de modelos sigue siendo relevante, como evidencia la noticia sobre la adquisición estratégica de Groq para potenciar capacidades.

Junto a la versión estándar, OpenAI ha puesto en marcha GPT-5.4 Pro, orientado a escenarios de alta exigencia donde se manejan cargas de trabajo intensivas. Esta variante está disponible en ChatGPT y a través de la API, y está pensada para sectores como la ingeniería, las finanzas, la analítica de datos o la consultoría, donde se requieren respuestas consistentes y un uso eficiente del contexto en sesiones muy largas.

En entornos reales, GPT-5.4 Pro ofrece más estabilidad en procesos extensos y mejor comportamiento cuando se combinan tareas de cálculo, análisis documental y automatización. Para una empresa española o europea que trabaje con grandes volúmenes de datos, esto puede implicar acelerar auditorías, revisiones de código, conciliaciones financieras o elaboración de informes complejos. Además, el despliegue en entornos empresariales se apoya en infraestructuras locales y servicios de edge como los que empiezan a activarse en España por algunos operadores (servicios Edge en España).

Función Thinking: ver el plan de la IA y ajustarlo en tiempo real

Interfaz de IA mostrando su razonamiento

Otra de las incorporaciones destacadas en esta generación es la función Thinking, heredera de GPT-4.5 pero ahora integrada en GPT-5.4 como una pieza central de la experiencia. En la interfaz de ChatGPT, el modo Thinking permite ver de antemano el esquema de razonamiento que el modelo pretende seguir para resolver una tarea, en vez de limitarse a mostrar solo el resultado final.

Este enfoque ofrece al usuario la posibilidad de detener la ejecución a mitad de un flujo de trabajo, corregir indicaciones o matizar objetivos sin tener que reiniciar la conversación desde cero. En tareas largas —como la preparación de un informe jurídico, una investigación de mercado o el análisis de un repositorio de código— es más sencillo alinear a la IA con lo que realmente se necesita.

OpenAI explica que esta función también mejora la calidad de las investigaciones complejas y de las búsquedas en profundidad, manteniendo el contexto entre varias consultas relacionadas. Para equipos de investigación europeos, departamentos de compliance o analistas de datos, poder seguir el hilo del razonamiento reduce sorpresas indeseadas y facilita justificar cómo se ha llegado a una determinada conclusión.

Además, el modo Thinking refuerza la transparencia de los agentes de IA al mostrar, aunque sea de forma resumida, qué pasos intermedios planea ejecutar el modelo al interactuar con documentos, aplicaciones o servicios. Esto resulta especialmente relevante en organizaciones que deben cumplir con normativas de protección de datos y auditoría técnica dentro de la Unión Europea.

Más eficiencia, menos errores y rendimiento superior a la media humana

En el apartado de rendimiento bruto, OpenAI subraya que GPT-5.4 consume menos tokens para llegar a soluciones válidas que generaciones como GPT-5.2. Este aumento de eficiencia tiene impacto directo en costes para empresas que utilizan de forma intensiva la API, ya que se reduce la cantidad de texto necesario para mantener el contexto y completar las tareas.

La compañía también asegura que el nuevo modelo es un 33 % menos propenso a generar afirmaciones incorrectas y que las respuestas completas presentan alrededor de un 18 % menos de errores frente a la versión anterior. Aunque estas cifras proceden de pruebas internas, apuntan a una disminución significativa de las típicas «alucinaciones» que tanto preocupan en ámbitos críticos como la programación, la contabilidad o la elaboración de informes regulatorios.

Uno de los datos más llamativos es que GPT-5.4 ha logrado superar la media humana en un benchmark de navegación de escritorios conocido como OSWorld. En estas pruebas, el modelo obtuvo una tasa de éxito del 75 % en la ejecución de acciones dentro del sistema operativo, por encima del 72,4 % atribuido al rendimiento medio de personas y muy por delante del 47,3 % que alcanzaba GPT-5.2.

Este tipo de benchmarks miden la capacidad de la IA para manejar ventanas, encontrar opciones en menús, configurar aplicaciones, rellenar campos y completar procesos habituales en un ordenador de uso diario. Para las empresas europeas, estos resultados refuerzan la idea de que ciertos procedimientos repetitivos pueden delegarse en agentes de IA con un nivel de fiabilidad cada vez mayor.

En conjunto, las mejoras de precisión, eficiencia y control del escritorio contribuyen a reducir la carga de supervisión humana sobre tareas rutinarias, dejando a los equipos más margen para centrarse en decisiones estratégicas, creatividad y análisis de alto nivel.

Planes, variantes y disponibilidad en España y Europa

GPT-5.4 se integra en la gama de productos de OpenAI como su modelo de vanguardia orientado al trabajo profesional y la automatización de flujos de trabajo. En el caso de España y del resto de Europa, el acceso está disponible a través de las suscripciones de ChatGPT en los planes Plus, Pro y Team, lo que facilita que tanto autónomos como pymes y equipos distribuidos puedan poner a prueba estas capacidades sin despliegues complejos.

Además, GPT-5.4 y GPT-5.4 Pro se ofrecen mediante la API de OpenAI, lo que permite a empresas y desarrolladores europeos integrarlos directamente en sus propias aplicaciones y servicios. Desde plataformas internas de gestión hasta herramientas de atención al cliente, pasando por sistemas de soporte técnico o backoffice financiero, los agentes pueden incorporarse como una capa adicional que controla el ordenador y los programas corporativos.

La compañía remarca que GPT-5.4 concentra sus últimos avances en razonamiento, codificación y automatización, con el objetivo de convertirse en la pieza central de los agentes de IA que ejecutan procesos de negocio complejos. En sectores como la banca, la industria tecnológica, los servicios jurídicos o la administración pública, este tipo de soluciones abre posibilidades para rediseñar flujos de trabajo que hasta ahora dependían casi por completo de la intervención humana.

Para los usuarios finales con suscripción a ChatGPT, el modelo se presenta integrado en la interfaz habitual, con opciones como el modo Thinking para visualizar el plan de la IA y la posibilidad de combinar consultas conversacionales con tareas automáticas sobre el escritorio. Este enfoque busca que la transición hacia agentes más autónomos sea gradual y controlada, sin obligar a las organizaciones a cambiar de golpe sus herramientas principales.

Con todas estas novedades, GPT-5.4 se sitúa como un modelo que marca un cambio de etapa en el uso de la inteligencia artificial en España y en Europa. Deja de ser únicamente un generador de texto o código para convertirse en un operador autónomo dentro del ordenador, capaz de moverse por aplicaciones, coordinar herramientas y completar tareas de principio a fin. Al mismo tiempo, introduce mejoras en razonamiento, programación, eficiencia y transparencia que buscan hacer más fiable su adopción en entornos profesionales donde la precisión y el control siguen siendo esenciales.

from Actualidad Gadget https://ift.tt/BExJzMG
via IFTTT