Operator: la inteligencia artificial que ejecuta tareas por ti

OpenAI ha presentado Operator, un agente impulsado por inteligencia artificial que puede realizar tareas en páginas web de forma autónoma. Desde completar formularios hasta realizar pedidos de comida o crear memes, Operator tiene la capacidad de interactuar directamente con las interfaces gráficas que los usuarios utilizan cotidianamente.

Operator opera gracias a un modelo avanzado denominado Computer Using Agent (CUA), que combina visión computacional basada en GPT-4 y razonamiento avanzado con aprendizaje por refuerzo. Esta tecnología permite que el agente interactúe con botones, menús y campos de texto visibles en las pantallas, tal como lo haría un ser humano.

El agente procesa las páginas web mediante capturas de pantalla, lo que elimina la necesidad de integraciones específicas con APIs. Además, puede autocorregir errores y superar desafíos, aunque en situaciones complejas, devuelve el control al usuario para resolver el problema.

https://i.blogs.es/e9657c/funcionamiento-cua/1366_2000.jpeg

Para utilizar Operator, el usuario solo debe proporcionar una descripción de la tarea como si fuera un prompt. Por ejemplo, se le puede pedir que reserve un vuelo, gestione varias tareas simultáneamente o incluso que realice búsquedas específicas.

Aunque la inteligencia artificial trabaja de manera autónoma, el usuario conserva el control total en todo momento y puede intervenir en tareas delicadas, como ingresar información de pago o resolver CAPTCHAs. Además, Operator permite personalizar preferencias, como seleccionar aerolíneas favoritas o aplicar criterios para buscar ofertas.

Seguridad y privacidad: las prioridades de Operator

OpenAI ha implementado tres niveles de protección para garantizar la seguridad de los usuarios:

  1. Control del usuario:
    • La IA solicita confirmaciones antes de realizar acciones importantes, como enviar correos electrónicos.
    • Rechaza tareas de alto riesgo, como transacciones bancarias o postulaciones laborales.
    • Incluye un modo de vigilancia para identificar errores en los sitios web.
  2. Gestión de la privacidad:
    • Ofrece la opción de desactivar el uso de datos para mejorar los modelos de OpenAI.
    • Permite eliminar completamente el historial de navegación.
  3. Defensas contra amenazas externas:
    • Protege contra sitios maliciosos que intenten engañar al sistema mediante mensajes ocultos o intentos de phishing.

¿Cuándo estará disponible Operator?

Por ahora, Operator se encuentra en una fase inicial de investigación y aprendizaje, lo que implica que puede cometer errores al realizar ciertas tareas, como gestionar calendarios o crear presentaciones.

Inicialmente, estará disponible para usuarios del plan Pro en Estados Unidos. Posteriormente, se planea expandir su alcance a los planes Plus, Teams y Enterprise, ofreciendo a más personas la posibilidad de experimentar este revolucionario agente de IA.

Entradas relacionadas

Deja tu comentario