OpenAI, la compañía de San Francisco que creó ChatGpt , ha lanzado oficialmente su primer Agente de IA, Operator , capaz de realizar de forma autónoma ciertas operaciones en la web “en lugar del usuario” .
La compañía dirigida por Sam Altman ha anunciado que una primera versión de Operator, aunque experimental, estará disponible para los suscriptores estadounidenses de ChatGpt Pro, que pagan 200 dólares al mes para acceder a la versión más potente del chatbot basado en los modelos de inteligencia artificial más avanzados de OpenAI: desde Gpt-4o hasta o1 .
Operador es un Agente de IA, es decir, una inteligencia artificial avanzada capaz de realizar una cadena de operaciones como lo haría un humano: por ejemplo, navegar por la web, hacer clic en botones y completar formularios para reservar cenas en un restaurante o una habitación de hotel. Todo sin necesidad de supervisión humana constante.
El operador también puede buscar un vuelo adecuado a las necesidades del usuario y comprar el billete de avión, pero en este caso antes de realizar el pago pedirá los datos de la tarjeta de crédito y una autorización para proceder.
La nueva inteligencia artificial de OpenAI combina las capacidades visuales de Gpt-4o y el razonamiento avanzado basado en el aprendizaje por refuerzo: en otras palabras, la IA aprende de sus propios errores , y cuando no puede resolver una tarea, pide ayuda al usuario humano.
Ya hemos visto en acción un Agente de IA similar a Operator, presentado el pasado mes de octubre por Anthropic : se llama “Computer Use” y toma posesión del ordenador de un usuario, moviendo incluso la flecha del ratón en la pantalla como lo haría una persona.
Google y Microsoft también están desarrollando Agentes de IA similares a los de Anthropic y OpenAI, con el objetivo de automatizar operaciones complejas que van más allá de la “simple” generación de texto, imágenes y vídeos por parte de inteligencias artificiales.
La llegada de “agentes” impulsados por IA podría transformar la forma en que las personas interactúan con la tecnología, alterando industrias como el comercio electrónico y el servicio al cliente .
OpenAI dijo que está trabajando con empresas como DoorDash , Instacart, OpenTable, Priceline, StubHub , Thumbtack y Uber para ayudar al operador a conocer qué necesidades podrían surgir en el mundo real y cómo satisfacerlas «cumpliendo las políticas y los términos del servicio».
Pero la compañía de San Francisco también dijo que Operator puede tener dificultades con interfaces complejas que requieren, por ejemplo, la creación de diapositivas o la gestión de un calendario de citas.
Los investigadores antrópicos también advirtieron hace unos meses sobre las limitaciones del “uso de la computadora” de Claude : “Algunas acciones que las personas realizan sin esfuerzo, como desplazarse, arrastrar, hacer zoom, actualmente presentan desafíos para la IA”.