Regulación de IA

OpenAI lanza computer use en Codex: cuando tu Mac trabaja solo mientras duermes (y por qué Europa se queda fuera)

Admin Por Admin 21 abr., 2026 10 min de lectura
Compartir:
OpenAI lanza computer use en Codex: cuando tu Mac trabaja solo mientras duermes (y por qué Europa se queda fuera)
Fuente: Wwwhatsnew.com

Imagina despertar y encontrar que tu ordenador ha estado trabajando durante la noche: ejecutando tests, iterando sobre diseños de interfaz, revisando pull requests en GitHub y programando las siguientes tareas del proyecto. No es ciencia ficción ni un script personalizado que tardaste semanas en configurar. Es la nueva versión de Codex para Mac que OpenAI acaba de lanzar, y representa un salto cualitativo en cómo los desarrolladores interactúan con herramientas de inteligencia artificial. Pero hay un detalle incómodo: si vives en la Unión Europea o Reino Unido, tendrás que esperar meses para probarlo, en otro episodio más de la creciente brecha tecnológica transatlántica impulsada por consideraciones regulatorias.

Computer use: el agente que controla tu Mac sin tocarlo

La actualización más significativa de Codex es la incorporación de computer use, una capacidad que permite al agente de IA operar aplicaciones del Mac de forma autónoma. Codex ahora puede ver lo que hay en pantalla, mover su propio cursor, hacer clic en elementos de la interfaz y escribir texto para completar tareas complejas. La tecnología no es completamente nueva —Anthropic la introdujo en Claude hace meses— pero su llegada a Codex elimina la principal razón por la que muchos desarrolladores mantenían suscripciones paralelas a ambas plataformas.

Lo que distingue la implementación de OpenAI es la capacidad de ejecutar múltiples agentes en paralelo sin interferir con el trabajo del usuario. Mientras tú escribes código en un proyecto, Codex puede estar ejecutando tests de interfaz en otro, iterando sobre cambios de diseño frontend o automatizando flujos que tradicionalmente requerían supervisión humana constante. Esta arquitectura multi-agente convierte al Mac en un espacio de trabajo colaborativo donde humanos y sistemas de IA operan simultáneamente, cada uno en su propio contexto.

La funcionalidad está diseñada específicamente para casos de uso en desarrollo de software: testear aplicaciones navegando por interfaces como lo haría un usuario real, capturar errores visuales que los tests unitarios no detectan, y automatizar tareas repetitivas como llenar formularios o verificar flujos de autenticación. OpenAI promete que todo opera en un entorno sandbox, aunque los detalles técnicos de las protecciones específicas contra manipulación maliciosa no están completamente claros en el anuncio inicial. La historia de computer use en Claude mostró que las primeras versiones son propensas a interpretar mal interfaces ambiguas o hacer clic en elementos inesperados, y es razonable esperar que Codex atraviese una curva de aprendizaje similar.

Memoria persistente y automatización multi-día: el fin de las sesiones aisladas

Hasta ahora, los agentes de coding funcionaban como conversaciones efímeras: iniciabas una sesión, dabas instrucciones, el agente completaba la tarea (o fallaba intentándolo) y la siguiente interacción empezaba desde cero. Codex rompe ese modelo con memoria persistente entre sesiones. El sistema ahora recuerda preferencias de código, flujos de trabajo recurrentes, stacks tecnológicos específicos del usuario y decisiones arquitectónicas previas. Es la diferencia entre explicar tu proyecto cada vez que abres la aplicación y tener un compañero de equipo que ya conoce el contexto completo.

Pero la verdadera innovación está en la automatización multi-día. Codex puede pausar trabajo, retomar hilos de conversación existentes después de horas o días, programar tareas futuras y mantener continuidad en proyectos que se extienden durante semanas. Esto transforma fundamentalmente la naturaleza de la herramienta: deja de ser un asistente reactivo bajo demanda y se convierte en un proceso en segundo plano con capacidad de tomar decisiones, similar a los pipelines de integración continua pero con autonomía cognitiva.

Un desarrollador individual con acceso a automatización multi-día fiable podría gestionar proyectos que antes requerían un equipo pequeño, lo que tiene implicaciones laborales que van mucho más allá de la conveniencia técnica.

Las implicaciones son profundas. Si la tecnología funciona de forma consistente —y ese es un condicional importante, dado el historial de fiabilidad variable de los agentes de IA— estamos ante un cambio en la economía del desarrollo de software. La capacidad de un solo profesional se multiplica no linealmente sino exponencialmente cuando puede delegar trabajo cognitivo complejo a sistemas que operan 24/7. Esto plantea preguntas incómodas sobre la estructura de los equipos de desarrollo, la valoración del trabajo individual y la distribución de productividad en la industria tecnológica.

Ecosistema de plugins y la batalla con Claude Code

OpenAI no se limita a igualar capacidades existentes; intenta crear ventajas competitivas a través de un ecosistema. La actualización incluye más de 90 nuevos plugins que combinan skills específicas, integraciones con aplicaciones externas y servidores MCP (Model Context Protocol) para mejorar la recopilación de contexto y las acciones del agente. Este enfoque de plataforma abierta contrasta con el modelo más cerrado de Anthropic, aunque la calidad real de estos plugins determinará si se convierten en diferenciador genuino o en ruido que complica la experiencia de usuario.

Otras mejoras incluyen un navegador integrado donde los usuarios pueden comentar directamente sobre páginas web para dar instrucciones más precisas al agente. En futuras versiones, Codex podrá abrir sitios web de forma autónoma, recorrer flujos de usuario, tomar capturas de pantalla y analizar outputs. También se añade soporte para múltiples pestañas de terminal, respuesta automática a comentarios de revisión en GitHub y apertura de archivos directamente en la barra lateral con previews enriquecidas para PDFs y hojas de cálculo.

El timing del lanzamiento no es casual. Anthropic presentó el mismo día Claude Opus 4.7 con mejoras sustanciales en autonomía sostenida y capacidades de visión. Claude Code ha sido durante meses la referencia en coding agéntico, y OpenAI necesitaba urgentemente cerrar la brecha de funcionalidades. La adición de computer use elimina la principal razón que los usuarios citaban para mantener suscripciones paralelas a ambos servicios. Para muchos desarrolladores, especialmente aquellos ya integrados en el ecosistema de ChatGPT, la decisión ahora se reduce a preferencias de modelo subyacente y calidad de integración, no a capacidades fundamentalmente diferentes.

El problema europeo: regulación como barrera de entrada tecnológica

Aquí es donde la narrativa se complica. Las funcionalidades de personalización —memoria persistente, plugins y automatización multi-día— no están disponibles para usuarios Enterprise, Education, ni para ningún usuario en la Unión Europea o Reino Unido. OpenAI promete que llegarán "pronto", pero el patrón es familiar y preocupante. Computer use tampoco está activo en estos territorios, probablemente por consideraciones relacionadas con el EU AI Act y normativas de privacidad como el GDPR.

Este retraso geográfico se está consolidando como norma en la industria de IA. Cada capacidad avanzada —desde generación de imágenes realistas hasta agentes autónomos— llega primero a Estados Unidos y tarda meses, a veces más de un año, en cruzar el Atlántico. Para empresas europeas que compiten globalmente, esto representa una desventaja competitiva real. Un desarrollador en San Francisco tiene acceso hoy a herramientas que su equivalente en Berlín o Londres no podrá usar hasta bien entrado el verano, asumiendo que las aprobaciones regulatorias se completen sin contratiempos.

La tensión entre protección regulatoria y acceso a innovación tecnológica no tiene soluciones fáciles. El EU AI Act busca legítimamente mitigar riesgos de sistemas de alto impacto, y las preocupaciones sobre privacidad en agentes que operan ordenadores de forma autónoma son válidas. Pero el costo de oportunidad es tangible: cada mes de retraso amplía la brecha de familiaridad, adopción y desarrollo de ecosistemas complementarios. Las empresas tecnológicas optimizan para mercados donde pueden iterar rápidamente, y Europa está quedando sistemáticamente relegada a segunda prioridad.

Contexto clave

¿Qué es computer use y por qué importa? Computer use es la capacidad de un agente de IA para controlar directamente un ordenador: ver la pantalla, mover el cursor, hacer clic y escribir texto como lo haría un humano. A diferencia de las APIs tradicionales que requieren integraciones específicas para cada aplicación, computer use permite al agente interactuar con cualquier software a través de su interfaz gráfica. Esto elimina la necesidad de construir conectores personalizados para cada herramienta y permite automatización de tareas que antes requerían intervención humana constante. El riesgo principal es la seguridad: un agente con control del ordenador puede ser manipulado por contenido malicioso en pantalla (prompt injection visual) o interpretar mal interfaces ambiguas con consecuencias no deseadas.

¿Qué es el Model Context Protocol (MCP)? MCP es un estándar abierto desarrollado por Anthropic para que los modelos de lenguaje accedan a contexto externo de forma estructurada y segura. En lugar de que cada aplicación implemente su propia forma de comunicarse con modelos de IA, MCP proporciona una interfaz común. Los servidores MCP actúan como intermediarios que traducen solicitudes del modelo en acciones específicas (leer archivos, consultar bases de datos, ejecutar comandos) y devuelven resultados en formato que el modelo puede procesar. Esto permite a herramientas como Codex acceder a información relevante del proyecto sin exponer todo el sistema de archivos o credenciales sensibles.

¿Por qué la memoria persistente cambia la naturaleza de los agentes? Los modelos de lenguaje tradicionales no tienen memoria real entre sesiones; cada conversación comienza desde cero. La memoria persistente permite al agente almacenar información sobre preferencias del usuario, decisiones previas y contexto del proyecto que persiste entre sesiones. Esto transforma al agente de un asistente que responde preguntas aisladas a un colaborador que acumula conocimiento sobre tu forma de trabajar. La diferencia es similar a la que existe entre consultar a un experto externo cada vez que necesitas ayuda versus trabajar con un compañero de equipo que ya conoce tu proyecto. El desafío técnico está en determinar qué información vale la pena recordar, cómo actualizarla cuando cambian las circunstancias y cómo proteger la privacidad de datos sensibles almacenados a largo plazo.

Para profundizar

  • La economía laboral del desarrollo agéntico — Si un desarrollador con acceso a agentes autónomos fiables puede hacer el trabajo de tres o cuatro profesionales tradicionales, ¿cómo se redistribuye el valor en la industria del software? ¿Se concentra en quienes saben orquestar agentes de IA, o se democratiza permitiendo que más personas sin formación técnica profunda construyan productos complejos? Las respuestas determinarán la estructura de la industria tecnológica en la próxima década.
  • Seguridad en agentes con control del ordenador — Computer use amplía dramáticamente la superficie de ataque de los sistemas de IA. Un agente manipulado por prompt injection visual podría ejecutar comandos maliciosos, exfiltrar datos o modificar configuraciones críticas. ¿Qué arquitecturas de seguridad son necesarias para hacer estos sistemas seguros en entornos de producción? ¿Son suficientes los sandboxes actuales o necesitamos nuevos paradigmas de aislamiento?
  • La brecha tecnológica transatlántica y sus consecuencias — Europa está sistemáticamente rezagada en acceso a capacidades avanzadas de IA por consideraciones regulatorias. ¿Es este un costo aceptable por mayor protección de derechos, o estamos ante una transferencia silenciosa de liderazgo tecnológico que tendrá consecuencias económicas y geopolíticas profundas? ¿Existe un modelo regulatorio que proteja sin excluir, o la tensión es fundamentalmente irreconciliable?
¿Te gustó este artículo?
Recibí lo mejor de ConocIA cada semana en tu correo.
Sin spam · Cancelá cuando quieras

Comentarios

Deja tu comentario
Tu email no será publicado.

No hay comentarios todavía. ¡Sé el primero en comentar!

Artículos relacionados