L’ère de l’agent AI est ici: le chatppt n’est plus seulement pour répondre à vos requêtes avec une réponse confiante, souvent extrêmement incorrecte, synthétisée à partir de masses de données grattées d’autres sources. Il sera désormais connecté à vos applications pour effectuer de vraies actions pour vous: réserver des billets, rechercher les prix, vérifier votre calendrier, créer des diaporamas et bien plus encore.
Ce nouveau service s’appelle ChatGpt Agent, et il donne essentiellement au bot AI son propre ordinateur virtuel dans vos conversations. Openai nous dit de nous attendre à un bot « se déplaçant de manière fluide entre le raisonnement et l’action pour gérer les flux de travail complexes du début à la fin, tous en fonction de vos instructions » – ce qui semble ambitieux et peut-être un peu effrayant.
Si vous êtes sur l’un des plans payants que Chatgpt propose (à partir de 20 $ par mois), vous pouvez essayer l’agent maintenant, donc j’ai pensé que je le mettrais à l’épreuve sur quelques projets inventés (je ne suis pas tout à fait prêt à lui faire confiance avec quelque chose de réel). Vous pouvez lancer l’agent Chatgpt dans l’application Web en cliquant sur le + (plus) bouton à gauche de la boîte d’invite et cueillette Mode agent.
Comment fonctionne le mode agent
Rien de trop dramatique ne se produit lorsque vous passez en mode agent: on vous demande simplement de décrire la tâche que vous souhaitez effectuer. Il n’y a pas de directives sur votre invite. Vous obtenez quelques suggestions à l’écran, de l’obtention du chatppt pour résumer les nouvelles, pour lui faire commander des produits d’épicerie.
Une fois que vous avez décidé ce que vous voulez que Chatgpt fasse, cela peut vous poser des questions de suivi pour plus de clarté, et l’interface n’est pas très différente d’une conversation régulière avec le bot AI. Quoi est Différent est une fenêtre intégrée qui vous donne une idée générale de ce que fait Chatgpt sur son propre ordinateur virtuel.
Ce n’est pas un flux en direct direct, mais Chatgpt vous dira ce qu’il fait et lancera des graphiques pour représenter chaque action. À tout moment, vous pouvez faire défiler vers l’arrière dans le flux ou prendre le contrôle de l’ordinateur de Chatgpt – à quel point vous verrez exactement ce que fait Chatgpt, comme si vous vous connectiez à un autre PC à distance.
Vous pouvez également passer à ce que l’on appelle un mode d’activité, où vous obtenez simplement un flux de texte de défilement des étapes que le chat de chat de chatte, sans les visuels. Il y a aussi la possibilité d’arrêter l’agent à tout moment, si vous sentez qu’il est en train de sortir ou de faire quelque chose que vous ne voulez pas qu’il fasse. Cela ne prend que quelques clics.
Lorsque l’agent Chatgpt a fini de faire tout ce que vous avez demandé de faire, vous recevrez un résumé et un rapport. Vous obtiendrez également une liste de sources au bas de la réponse finale, tout comme la norme pour les conversations Chatgpt, et il y a la possibilité de poser des questions de suivi, si nécessaire.
Dans l’ensemble, l’agent fonctionne bien, bien qu’il puisse prendre son temps: comme l’outil de recherche en profondeur, vous voudrez probablement configurer cela et ensuite faire autre chose pendant un certain temps. Cela signifie que vous ne pouvez pas regarder et vérifier chaque étape que fait Chatgpt, vous devrez donc décider à quel point vous lui faites confiance.
Comment s’est déroulée mon expérience d’agent Chatgpt
La première tâche que j’ai demandé à Chatgpt de faire était de planifier une fête d’anniversaire pour moi: je lui ai dit l’âge que je suis, quel genre de fête je voulais (une affaire discrète et discrète), le genre d’espace que je voulais (une petite pièce à côté d’un bar) et les dates potentielles que je considérais. J’ai également demandé à l’IA de proposer des invitations.
Et dans l’ensemble, le bot a fait un très bon travail. Il a identifié les sites locaux que je me serais choisis, bien qu’il ait rencontré certains problèmes pour obtenir des détails de réservation (l’ouverture des PDF du Web ne semblait pas fonctionner). Les illustrations et le texte de l’invitation étaient bien, si un peu générique, et le rapport final m’a donné un tableau de comparaison soigné pour m’aider à choisir un endroit pour organiser la fête et les coordonnées pour la réserver.
Pour ma prochaine expérience, j’ai essayé d’obtenir un agent ChatGpt pour produire une feuille de calcul bien formatée avec toutes les dates de lancement de l’iPhone, quelque chose qui m’aiderait vraiment dans mon travail et me ferait gagner du temps. Un point précis ici était que Chatgpt a bien fait pour identifier les sources fiables: Wikipedia, les communiqués de presse Apple et des sites comme MacRumors.
La feuille de calcul finale semblait pleinement précise pour autant que je sache et a été livrée dans une feuille de calcul Excel – je n’ai pas obtenu le formatage agréable que j’ai demandé, et la colonne des sources n’avait pas vraiment de sens, mais toutes les données clés étaient là. Cela a pris un certain temps à compiler, cependant, et je pense que j’aurais probablement pu le faire moi-même dans le même temps (même si j’étais libre de faire autre chose pendant que Chatgpt fonctionnait).
Je suis impressionné par l’agent lisse et capable de Chatgpt. Ce n’était pas parfait, mais la plupart du temps, il a pris les bonnes étapes et a réussi à passer à des tâches. Il y a une bonne quantité de transparence sur ce qu’il fait, et vous pouvez toujours prendre le contrôle au besoin.
Personnellement, cependant, ce sont le genre de tâches que je préfère encore faire moi-même. Je suis trop inquiet que l’agent de Chatgpt fait une erreur, manquait un détail ou ne comprenait pas une nuance pour y compter fortement. Votre propre seuil pour ce type de préoccupations pourrait être différent, et je soupçonne que de nombreux utilisateurs négligeront les problèmes mineurs en raison du temps que l’agent peut les sauver.
Divulgation: la société mère de Vie Associative, Ziff Davis, a déposé une plainte contre OpenAI en avril, alléguant qu’elle avait enfreint Ziff Davis Copyrights dans la formation et l’exploitation de ses systèmes d’IA.
