OPEN AI lance OPERATOR, un agent IA multitâches pour le web!

Article publié le 24 janvier 2025

OpenAI lance Operator, un agent capable d’exécuter des tâches sur le web de manière autonome. Utilisant son propre navigateur, Operator peut interagir avec des pages web en cliquant, tapant ou faisant défiler, sans nécessiter d’intégrations API spécifiques. Actuellement en phase de préproduction, cet outil est disponible pour les utilisateurs Pro aux États-Unis sur operator.chatgpt.com. Cette version initiale permettra d’améliorer l’agent grâce aux retours des utilisateurs.

Voici les principales fonctionnalités :

  • Operator peut effectuer des tâches répétitives sur navigateur, comme remplir des formulaires, commander des courses ou créer des mèmes.
  • Basé sur le modèle CUA (Computer-Using Agent), il combine les capacités de vision de GPT-4o et l’apprentissage par renforcement pour interagir avec des interfaces graphiques (boutons, menus, champs de texte).
  • Il peut « voir » via des captures d’écran et agir en utilisant les fonctionnalités de souris et de clavier.
  • En cas de difficulté, il peut se corriger seul ou demander l’intervention de l’utilisateur.

Et quelques premières pistes quant à son utilisation :

  • L’utilisateur décrit la tâche à effectuer, et Operator se charge de sa réalisation.
  • Il est possible de reprendre le contrôle à tout moment, notamment pour les tâches nécessitant des connexions, des paiements ou des CAPTCHAs.
  • Les workflows peuvent être personnalisés avec des instructions spécifiques, et des tâches multiples peuvent être exécutées simultanément.

Operator marque une avancée en transformant l’IA d’un outil passif en un participant actif. Il vise à simplifier les tâches des utilisateurs et à offrir de nouvelles opportunités, notamment aux entreprises afin d’améliorer l’expérience client. OpenAI collabore actuellement avec des entreprises comme DoorDash, Instacart, Uber, ainsi que des organisations publiques, comme la Ville de Stockton, pour développer des applications pratiques et accessibles.

Il s’agit là d’une nouvelle étape dans l’intégration des agents IA dans notre quotidien, avec le potentiel de révolutionner la manière dont nous interagissons avec le web.

Ce site utilise des cookies et vous donne le contrôle sur ce que vous souhaitez activer