Ce n’est pas tous les jours que vous entendez parler d’un outil d’IA qui pourrait littéralement prendre le volant de votre ordinateur et effectuer des tâches à votre place. Pourtant, c’est exactement ce qui fait le buzz autour de la rumeur « Operator » d’OpenAI. Bien qu’OpenAI n’ait pas officiellement confirmé la date de sortie, des fuites récentes suggèrent que le lancement pourrait avoir lieu bientôt. Voici ce qu’est Operator et ce que nous savons jusqu’à présent.
Commençons par la grande fuite
Un ingénieur logiciel nommé Tibor Blaho, qui a été assez précis sur les fuites de produits d’IA dans le passé, a trouvé des indices intéressants dans le Application de bureau ChatGPT pour macOS. Les menus cachés de l’application de bureau macOS permettent aux utilisateurs de définir des raccourcis pour Opérateur bascule et Forcer l’opérateur à quitter.
Pourquoi est-ce si important ? Parce qu’il s’aligne avec rumeurs antérieures qu’OpenAI a travaillé sur un système agent secret capable d’effectuer des tâches complexes en votre nom. Cela a été provisoirement surnommé Opérateur.
Qu’est-ce que l’opérateur exactement ?
Considérez Operator comme un assistant IA qui ne se contente pas de répondre, mais effectue plutôt les tâches à votre place sur votre appareil. Qu’il s’agisse de réserver des vols en ligne, de lancer des applications ou d’écrire et de tester du code, Operator gérera des tâches en plusieurs étapes sans avoir besoin d’une intervention humaine constante. Il s’agit essentiellement d’un agent IA qui peut « voir » et « cliquer » sur votre ordinateur avec peu ou pas d’assistance humaine.
En termes simples, Operator automatise des tâches comme Google Assistant ou Alexa, mais de manière bien plus intelligente. Par exemple, si vous demandez à l’opérateur « Envoyer un e-mail à John résumant ma récente réunion » :
- Il recherche vos notes ou même transcrit les enregistrements de réunions pour en extraire les points clés.
- Il génère un résumé.
- Il personnalise le ton en fonction des e-mails précédents envoyés à John.
- Enfin, il envoie un e-mail, éventuellement après une vérification rapide de votre part.
En revanche, Google Assistant ou Alexa vous demanderaient de fournir l’objet et le corps de l’e-mail, vous laissant ainsi une grande partie de la tâche. Bien sûr, cela signifie également que l’opérateur peut commettre des erreurs, ce qui peut être terrifiant à imaginer.
Non seulement OpenAI, mais d’autres sociétés d’IA développent également leurs propres agents d’IA. Par exemple, Google travaille sur le projet Mariner, conçu pour effectuer des tâches dans le navigateur Chrome. De même, Anthropic a introduit Claude Computer Use, qui permet actuellement de contrôler un PC virtuel. Même les développeurs open source s’impliquent dans le buzz autour des agents IA.
Fuites de performances : le bon et le moins bon
Même si l’idée d’avoir un assistant numérique personnel qui ne dort jamais est passionnante, la réalité, du moins pour l’instant, est qu’elle est loin d’être parfaite. Selon des références divulguées (découvertes par Blaho) :
- L’agent d’utilisation informatique (CUA) d’OpenAI, qui pourrait être le modèle d’IA de base exécutant Operator, obtient un score de 38,1 % à un test appelé OSWorld. Les humains auraient obtenu un score de 72,4 % au même test.
- Sur WebVoyager, qui mesure la façon dont une IA navigue et interagit avec les sites Web, Operator surpasse en fait les scores humains. C’est prometteur !
- Cependant, sur WebArena, une autre référence basée sur le Web, les performances ne sont pas tout à fait au niveau humain.
- Dans des tâches telles que l’inscription à un fournisseur de cloud et le lancement d’une machine virtuelle, Operator n’a réussi que 60 % du temps.
- Pour la création d’un portefeuille Bitcoin, cela n’a réussi que 10 % du temps.
Le site Web OpenAI contient déjà des références à Operator/OpenAI CUA (Computer Use Agent) – « Operator System Card Table », « Operator Research Eval Table » et « Operator Refusal Rate Table »
Y compris comparaison avec Claude 3.5 Utilisation de l’ordinateur Sonnet, Google Mariner, etc.
(aperçu des tableaux… pic.twitter.com/OOBgC3ddkU
– Tibor Blaho (@btibor91) 20 janvier 2025
C’est donc définitivement un travail en cours. Imaginez dire à l’opérateur de vous réserver un vol vers New York et il finit par vous envoyer à Toronto. Cela pourrait arriver, même si nous espérons que ces problèmes seront résolus avant une sortie publique.
Alors, quand pouvons-nous nous y attendre ?
Des sources comme TechCrunch et Les informations ont laissé entendre qu’OpenAI ciblait Janvier pour une version Opérateur (ou au moins un aperçu recherche/développeur). Bien que rien d’officiel n’ait été annoncé, voir ces paramètres cachés apparaître dans l’application macOS suggère que nous pourrions être proches.
Cela pourrait-il être retardé ? Absolument. Les outils d’IA de ce calibre ne sont pas anodins. De plus, on dit qu’OpenAI souhaite s’assurer que l’outil est robuste et sûr avant de le lancer dans le monde.
Lire aussi :
Qu’en est-il des problèmes de sécurité et de confidentialité ?
Tout outil d’IA capable de contrôler des parties de votre ordinateur et d’effectuer des achats en votre nom ne manquera pas de faire sourciller. La rumeur dit que le long cycle de développement d’Operator pourrait être lié à tests de sécurité– et pour cause.
L’un des graphiques divulgués montrerait que l’opérateur obtient de bons résultats lors des évaluations de sécurité conçues pour voir s’il peut être amené à faire quelque chose de malveillant, comme la recherche de données personnelles sensibles. Mais comme pour tout système d’IA avancé, il existe toujours un risque.
Certains experts craignent que si l’opérateur (et les agents IA concurrents) deviennent trop puissants, ils pourraient être manipulés dans des tâches néfastes. C’est probablement pourquoi le co-fondateur d’OpenAI Wojciech Zaremba a récemment jeté un coup d’œil à Anthropic pour avoir publié leur agent d’IA Computer Use, affirmant qu’il manquait de mesures d’atténuation de sécurité appropriées.
Un mot sur macOS vs Windows
Jusqu’à présent, tous les principaux indices sur Operator proviennent du Application de bureau macOS pour ChatGPT. Alors qu’en est-il de Windows ? De nombreuses personnes sur les réseaux sociaux ont a exprimé des inquiétudes que l’application Windows est moins reconnue, d’autant plus que Microsoft est un énorme investisseur dans OpenAI.