Qué es y cómo funciona Operator, la nueva herramienta de OpenAI que hace tareas por usted: aprende sus movimientos en la red

OpenAI sigue sorprendiendo y presentó la versión preliminar de Operator, un agente que combina las capacidades del modelo GPT-4o con un razonamiento avanzado a través del aprendizaje y puede interactuar con interfaces gráficas de usuario (GUI, por sus siglas en inglés) para navegar por internet de forma autónoma, como si se tratara de un humano.

Esta herramienta funciona con un nuevo modelo denominado Computer-Using Agent (CUA) y se basa “en años de investigación fundamental en la intersección entre la comprensión y el razonamiento multimodal”, según ha explicado la desarrolladora en un comunicado.

Al combinar la percepción avanzada de la interfaz gráfica de usuario con la resolución de problemas, este CUA es capaz de dividir las tareas para ejecutarlas en varios pasos, adaptarse de forma dinámica cuando surgen cambios inesperados y autocorregirse si ejecuta alguna acción de forma incorrecta.

Varios usuarios reportaron fallas con el servicio de ChatGPT.

Contexto: Nueva caída mundial de ChatGPT desató ola de memes en redes sociales: esto es lo que se sabe

Este nuevo asistente puede hacer múltiples tareas por los humanos. Aprende y ejecuta órdenes como completar formularios, hacer pedidos, etc. | Foto: Captura de pantalla OpenAI

“Hoy lanzamos Operator, un agente que puede acceder a la web para realizar tareas por usted. Mediante su propio navegador, puede ver una página web e interactuar con ella escribiendo, haciendo clic y desplazándose. Actualmente, es una versión preliminar de investigación, lo que significa que tiene limitaciones y evolucionará en función de los comentarios de los usuarios. Operator es uno de nuestros primeros agentes, que son IA capaces de realizar el trabajo por usted de forma independiente: le da una tarea y la ejecutará”, señalaron desde OpenAI.

2. Las 6 aplicaciones que debe desinstalar para proteger su cuenta y no ser estafado

3. “Los veo, fachitos de mie*”, el polémico mensaje que compartió el presidente Gustavo Petro en sus redes sociales - Semana

Más concretamente, el modelo, que combina GPT-4o con un razonamiento avanzado, procesa datos de los píxeles de la pantalla para comprender lo que sucede en ella y utiliza un ratón y un teclado virtual para completar las acciones de forma autónoma, con acciones como hacer clic, desplazarse o escribir.

De este modo, puede actuar con capacidades humanas en una amplia gama de entornos digitales, interactuar con botones, menús y campos de texto (GUI), realizar tareas como complementar formularios y navegar por sitios web sin necesidad de interfaces de programación de aplicaciones (API) especializadas.

No obstante, la compañía tecnológica ha señalado que aunque este modelo maneja la mayoría de los pasos de forma automática, busca la confirmación del usuario para acciones sensibles. Por ejemplo, ingresar datos de inicio de sesión, responder formularios CAPTCHA o ejecutar una transacción bancaria.

OpenAI sorprendió con este nuevo lanzamiento que se encuentra en fase de prueba. | Foto: NurPhoto via Getty Images

Debido a estas capacidades, OpenAI ha señalado que su nuevo trabajo “marca el siguiente paso en el desarrollo de la IA, debido a que permite que los modelos utilicen las mismas herramientas de las que dependen los humanos a diario y abre la puerta a una amplia gama de nuevas aplicaciones”.

CUA aún se encuentra en una etapa temprana de desarrollo y tiene algunas limitaciones. Asimismo, está avalado por WebArena y WebVoyager, logrando una tasa de éxito del 58,1 por ciento en la primera y un 87 por ciento en la segunda.

Operator is one of our first agents, which are AIs capable of doing work for you independently—you give it a task and it will execute it. https://t.co/nbH7OMmkmO
— OpenAI (@OpenAI) January 23, 2025

Por otra parte, OpenAI ha señalado que OSWorld, un punto de referencia que evalúa la capacidad de los modelos para controlar sistemas operativos completos, como Ubuntu, Windows y macOS, le ha otorgado una tasa de éxito del 38,1 por ciento. No obstante, la compañía ha observado un escalamiento en tiempo de prueba, lo que quiere decir que el rendimiento de modelo mejora cuando debe ejecutar más pasos o acciones.

La firma también ha subrayado que CUA se ha desarrollado con la seguridad como máxima prioridad para abordar los desafíos que plantea el acceso de un agente al mundo real. De esta manera, está entrenado para rechazar tareas dañinas y actividades ilegales o irregulares.

Tampoco puede acceder a sitios web que la propia OpenAI ha bloqueado de forma preventiva, como webs de contenidos para adultos o juegos de azar, y es capaz de identificar actividades fraudulentas. De ese modo, monitoriza la actividad y pausa la ejecución de una acción si detecta contenido sospechoso en el panel.

OpenAI permite conversar con ChatGPT a través de WhatsApp y llamadas telefónicas, con el nuevo contacto 1-800-ChatGPT.

Contexto: ChatGPT en WhatsApp: esta es la nueva forma de interactuar con la inteligencia artificial

Este nuevo servicio estará, pro ahora, disponible entre los usuarios premium de Estados Unidos. | Foto: Composición de SEMANA: con imagen de Getty y ChatGPT

“Se le puede pedir al operador que se encargue de una amplia variedad de tareas repetitivas del navegador, como completar formularios, realizar pedidos de comestibles e incluso crear memes. La capacidad de utilizar las mismas interfaces y herramientas con las que los humanos interactúan a diario amplía la utilidad de la IA, lo que ayuda a las personas a ahorrar tiempo en las tareas cotidianas y, al mismo tiempo, abre nuevas oportunidades de interacción para las empresas”, agregó la compañía.

Por el momento, este agente se está implementando a través de una vista previa de investigación a través de operator.chatgpt.com y ya tienen acceso a él los suscriptores del nivel Pro en Estados Unidos. Próximamente, planea llevarlo a usuarios de Plus, Team y Enterprise, así como integrar sus capacidades en ChatGPT.

A research preview of Operator, an agent that can use its own browser to perform tasks for you. pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI) January 23, 2025

Encuentra aquí lo último en Semana

1. Video muestra angustioso momento que se vivió en Barranquilla luego de que Policía se disparara tras atropellar a niña

2. Gobierno Petro reconoce que acciones del ELN “desbordan la capacidad del Estado” y dice que atribuciones de la Fuerza Pública “no son suficientes” ante nuevos ataques

3. Aerolínea que vuela en Colombia anuncia nuevas prohibiciones a pasajeros: no los dejarían abordar

4. Negocio entre Liverpool de Luis Díaz y Real Madrid tuvo veredicto: “Difícil de rechazar”

5. Putin está listo y espera “recibir señales” para hablar con Trump sobre el futuro de la guerra en Ucrania, asegura el Kremlin

LEER MENOS

Noticias relacionadas

OpenAI Inteligencia Artificial ChatGPT

Encuentra aquí lo último en Semana

1. Video muestra angustioso momento que se vivió en Barranquilla luego de que Policía se disparara tras atropellar a niña

2. Gobierno Petro reconoce que acciones del ELN “desbordan la capacidad del Estado” y dice que atribuciones de la Fuerza Pública “no son suficientes” ante nuevos ataques

3. Aerolínea que vuela en Colombia anuncia nuevas prohibiciones a pasajeros: no los dejarían abordar

4. Negocio entre Liverpool de Luis Díaz y Real Madrid tuvo veredicto: “Difícil de rechazar”

5. Putin está listo y espera “recibir señales” para hablar con Trump sobre el futuro de la guerra en Ucrania, asegura el Kremlin

LEER MENOS

Qué es y cómo funciona Operator, la nueva herramienta de OpenAI que hace tareas por usted: aprende sus movimientos en la red

Lo más leído

Encuentra aquí lo último en Semana

1. Video muestra angustioso momento que se vivió en Barranquilla luego de que Policía se disparara tras atropellar a niña

2. Gobierno Petro reconoce que acciones del ELN “desbordan la capacidad del Estado” y dice que atribuciones de la Fuerza Pública “no son suficientes” ante nuevos ataques

3. Aerolínea que vuela en Colombia anuncia nuevas prohibiciones a pasajeros: no los dejarían abordar

4. Negocio entre Liverpool de Luis Díaz y Real Madrid tuvo veredicto: “Difícil de rechazar”

5. Putin está listo y espera “recibir señales” para hablar con Trump sobre el futuro de la guerra en Ucrania, asegura el Kremlin

Noticias relacionadas

Encuentra aquí lo último en Semana

1. Video muestra angustioso momento que se vivió en Barranquilla luego de que Policía se disparara tras atropellar a niña

2. Gobierno Petro reconoce que acciones del ELN “desbordan la capacidad del Estado” y dice que atribuciones de la Fuerza Pública “no son suficientes” ante nuevos ataques

3. Aerolínea que vuela en Colombia anuncia nuevas prohibiciones a pasajeros: no los dejarían abordar

4. Negocio entre Liverpool de Luis Díaz y Real Madrid tuvo veredicto: “Difícil de rechazar”

5. Putin está listo y espera “recibir señales” para hablar con Trump sobre el futuro de la guerra en Ucrania, asegura el Kremlin

Noticias Destacadas

Bill Gates reveló una de las “posesiones más preciadas” que le dejó su padre; fue clave para lograr el éxito con Microsoft

El significado detrás de que las empresas ofrezcan un vaso de agua en entrevistas de trabajo, según la inteligencia artificial

Alerta por ‘estafa de la llamada perdida’: así es como delincuentes usan números internacionales para ‘vaciar’ cuentas bancarias

Las 6 aplicaciones que debe desinstalar de inmediato para proteger su cuenta bancaria y evitar ser estafado

Cuidado con la ‘búsqueda web’ de ChatGPT: expertos advierten sobre los peligros de usar la función

Qué es y cómo funciona Operator, la nueva herramienta de OpenAI que hace tareas por usted: aprende sus movimientos en la red