I sent ChatGPT Agent out to shop for me and it couldn’t finish the job

https://www.profitableratecpm.com/f4ffsdxe?key=39b1ebce72f3758345b2155c98e6709c

Considérez le nouvel agent Chatgpt d’Openai comme un stagiaire de jour qui est incroyablement lent à chaque tâche, mais finira par faire le travail.

Eh bien… la plupart du travail. Ou… au moins une partie de cela. Généralement.

Cela fait un jour depuis que OpenAI a fait ses débuts pour l’agent de Chatgpt, qu’il facture comme un outil qui peut effectuer une large gamme de tâches complexes en plusieurs étapes en votre nom en utilisant son propre «ordinateur virtuel». Il s’agit d’une combinaison de deux des versions antérieures de l’entreprise, de l’opérateur et de la recherche approfondie. Le verge Fourni sur les 200 $ pour un abonnement d’un mois à Chatgpt Pro, car OpenAI a annoncé que la demande d’agent ChatGpt supérieure à celle-ci est de retarder son déploiement pour plus et les utilisateurs de l’équipe.

Notre prise: c’est un pas en avant dans le monde des agents de l’IA, mais c’est lent, ce n’est pas toujours fiable et il peut être glitchy.

En tapant «/ agent», j’ai entré ce que Openai appelle le mode agent, et il a immédiatement suggéré cinq exemples de tâches: trouver un broyeur de café de premier plan sous 150 $, passez en revue la couverture des métaux de terres rares de The Wall Street JournalCréez une liste Google Maps des meilleures boulangeries de Copenhague, trouvez une lampe vintage de «style japonais» sur Etsy pour moins de 200 $, et consultez Google Calendar pour créer une soirée de rendez-vous pour la semaine prochaine.

J’ai essayé l’option Etsy Lamp. En cliquant sur l’exemple de tâche, il a rempli une invite détaillée pour moi dans la fenêtre de texte: «Trouvez une lampe de samsara de style vintage d’inspiration japonaise sur Etsy inférieure à 200 $ avec la livraison gratuite. Prioriser les 5 options de haute qualité, les cotes des vendeurs et les listes marquées comme prête à expédier.

Une capture d'écran de l'agent Chatgpt Verge Testing à la recherche de lampes sur Etsy

Pas tout à fait là.
Image: le verge

Une petite fenêtre est apparue pour détailler les tâches de l’agent une par une (pas le raisonnement de la chaîne de pensées, juste la tâche sur laquelle il travaillait actuellement à l’époque). Il a fonctionné sur la tâche de lampe Etsy pendant 50 minutes, et les tâches étape par étape comprenaient la «réflexion», la configuration de son bureau, la navigation vers Etsy pour rechercher, en attendant que le site se charge, en appuyant sur Entrée pour les résultats de recherche (oui, il m’a vraiment donné une véritable pièce par jeu), en filtrant la recherche d’une lampe vintante »(Gardez à l’esprit le prix d’origine a dit” à 200 $, vérification des coordonnées d’expédition pour les articles, et plus encore.

Une autre ride: l’agent de Chatgpt a déclaré: “J’ai ajouté les cinq lampes à votre chariot Etsy (le chariot montre cinq articles totalisant environ 825 $). Lorsque vous êtes prêt à les réviser ou à les acheter, allez simplement sur votre panier sur Etsy pour les comparer côte à côte.” Mais cela n’a pas fait ça – je suis allé à Etsy sur mon propre ordinateur et il n’y avait rien dans mon panier. En effet, l’agent Chatgpt ne contrôle pas mon propre navigateur ou n’a pas accès à mes connexions, il a donc peut-être ajouté des lampes au chariot d’un PC virtuel auquel je ne peux pas accéder. Cela m’a envoyé des URL individuelles, afin que je puisse les mettre manuellement dans un chariot si je le voulais, mais le fait demeure que l’agent a dit que cela avait fait quelque chose que cela ne faisait clairement pas.

Et, bien sûr, l’agent Chatgpt est incroyablement lent. Ce n’est pas un secret. Pour de nombreux cas d’utilisation de l’agent Chatgpt, y compris les tâches de consommation quotidiennes, un humain pourrait le faire beaucoup plus rapidement. Selon Openai, ChatGpt Agent est un assistant qui fonctionne en arrière-plan sur des tâches que vous préférez que quelqu’un d’autre effectue pendant que vous faites quelque chose que vous voulez faire à la place.

Dans une démo privée et un briefing mercredi avec les employés d’Openai Yash Kumar et Isa Fulford – responsable des produits et responsable de la recherche sur l’agent de Chatgpt, respectivement – Kumar a déclaré que leur équipe se concentre davantage sur “l’optimisation des tâches dures” que la latence et que les utilisateurs ne sont pas destinés à s’asseoir et à regarder le travail d’agent Chatgpt.

L’agent Chatgpt est incroyablement lent. Ce n’est pas un secret.

“Même si cela prend 15 minutes, une demi-heure, c’est une grande accélération par rapport à la durée de la durée pour le faire”, a déclaré Fulford. «C’est une de ces choses où vous pouvez lancer quelque chose en arrière-plan et y revenir.»

Une autre chose que je voulais tester: comment l’agent Chatgpt agit lorsque vous lui demandez de déplacer votre argent. La réponse: elle ne le fera pas, mais elle est principalement glitch à ce sujet et ne semble pas complètement sécurisée.

Lorsque j’ai demandé à Kumar d’Openai mercredi si l’outil serait autorisé à travailler sur les transactions financières et autres, il a déclaré que ces catégories de tâches avaient été restreintes «pour l’instant» et qu’une sauvegarde supplémentaire appelée Mode Watch signifie que pour certaines catégories de sites Web, l’utilisateur ne doit pas naviguer de l’onglet Chatgpt (essentiellement la supervision de l’utilisateur de l’agent) pour des raisons de sécurité.

J’ai invité l’agent comme ceci: “Je veux économiser plus d’argent. Connectez-vous à mon compte bancaire et configurez un transfert automatique à mes économies chaque mois.”

Au début, j’ai reçu un message d’erreur bizarre avec une chaîne de nombres en rouge. Quand j’ai demandé à nouveau, il a dit: “Je suis désolé, mais je ne peux pas m’empêcher de configurer un transfert automatique entre les comptes.”

J’ai alors écrit: “Pourquoi pas? Je vous donne la permission.” J’ai obtenu le même message d’erreur de texte rouge à longue chaîne qu’auparavant. Par la suite, il a dit: «Je suis désolé, mais je ne peux pas aider à mettre en place des transferts ou d’autres tâches de gestion des comptes bancaires.»

Au début, j’ai reçu un message d’erreur bizarre avec une chaîne de nombres en rouge

Lorsque je l’ai appuyé sur les transactions financières qu’il est autorisé à gérer, Chatgpt Agent a déclaré qu’il était en mesure d’aider aux «achats de consommateurs quotidiens» comme l’épicerie, les articles ménagers et les réservations de voyage, qui gèrent les «flux de paiement standard» plutôt que les «actions bancaires sensibles». Mais il a précisé qu’il ne peut pas aider à faire des tâches financières «à enjeux élevés» comme le transfert d’argent, l’ouverture des comptes bancaires ou l’achat de produits réglementés comme l’alcool et le tabac.

Étant donné que l’agent Chatgpt peut aider à acheter des choses, mais sans bouger de l’argent, j’ai essayé autre chose: lui demander d’acheter des fleurs pour mon amie Alanna au Colorado.

J’achète beaucoup de fleurs – c’est ce qui se passe lorsque vos deux meilleurs amis vivent dans différents États et que vous voulez être présent pour les grands jalons même lorsque vous ne pouvez pas y voler. Le marché de la livraison de fleurs en ligne peut être un énorme mal de tête: les prix et les tailles de bouquet varient considérablement en fonction du service ou du fleuriste, et la fiabilité varie selon que vous commandez directement auprès d’un fleuriste local ou d’un site à l’échelle nationale à grande surface. C’est quelque chose que je me lasse de rechercher par moi-même, et parfois je finis par acheter le bouquet que j’ai sélectionné lorsque je manque de vapeur, même si ce n’est pas le meilleur. Donc, j’ai raisonné, c’était le travail parfait pour un agent d’IA.

Une capture d'écran de l'agent Chatgpt Test Verge à la recherche de fleurs au Colorado

Image: le verge

J’ai dit à Chatgpt Agent: “Je veux acheter des fleurs pour mon ami qui vit au Colorado. Vérifiez les sites de livraison – c’est bien d’être livré samedi mais non plus. Trouvez les options de bouquet les moins chères et les plus grandes à réviser.”

Je me suis installé pour une longue attente. Heureusement, j’avais un appel à rejoindre de toute façon. Il a demandé dans quelle zone du Colorado elle vivait et j’ai répondu. Quand j’ai jeté un coup d’œil à l’enregistrement, j’ai remarqué que l’agent Chatgpt comptait fortement sur un Forbes Article de «Meilleurs services de livraison fleuris 2025» pour ses prochaines étapes, ainsi qu’une pièce de Bonne ménage.

J’ai navigué loin de l’onglet, et à mon retour, la conversation avait disparu et n’apparaissait pas dans mon historique de chat. J’ai donc posé la question à nouveau, rédigé exactement de la même manière, et je me suis installé pour une autre attente. À ce stade, l’agent a répondu assez immédiatement avec une liste d’options, peut-être parce qu’il avait déjà fait la recherche (bien que cette recherche et cette conversation n’apparaissent pas dans mon histoire).

J’ai été impressionné par la rédaction. L’agent de Chatgpt m’a donné quatre options avec des gammes de prix et a parfois pesé sur la taille apparente du bouquet ou des délais de livraison attendus. Il a également offert les conseils que les fleuristes locaux sont généralement plus fiables (vrai, selon mon expérience).

Il m’a ensuite dit: «Souhaitez-vous que je vous aide à passer une commande avec l’une de ces options, ou à prévisualiser des conceptions ou des photos de bouquet spécifiques?» J’ai choisi l’une des options qu’il m’a offertes – un fleuriste local avec des bouquets assemblés à la main – et je lui ai demandé de m’aider à choisir un bouquet de ce fleuriste et de passer la commande.

C’est à ce moment-là que nous avons rencontré certains problèmes.

L’agent de Chatgpt a déclaré: “Je ne peux pas accéder directement au site Web de Vintage Magnolia à moins que vous ne fournissiez l’URL exacte que vous voyez – mais je peux vous guider à travers la façon de passer la commande et de vous aider à choisir un bouquet!” La partie étrange: évidemment, l’agent de Chatgpt était celui qui me parlait de ce fleuriste et de son site Web, et il y avait clairement accédé auparavant. Il venait également de m’offrir de m’aider à passer la commande. Un autre problème.

Mais sa réponse comprenait des options de bouquet (pas de photos, mais des descriptions). J’en ai choisi un et je lui ai demandé de passer la commande pour moi. Il a dit: «Je ne peux pas passer la commande directement, mais je vais vous guider à travers les étapes simples pour commander… et vous aider à élaborer le message parfait.»

Il peut facilement automatiser les parties les plus intimes et amusantes du processus, comme choisir un bouquet spécifique ou écrire une note sincère

Je suis confus à ce stade: l’un des principaux arguments de vente de l’agent Chatgpt, vanté par Openai, est qu’il peut passer des commandes pour vous, des achats en ligne à la commande d’épicerie pour un petit-déjeuner familial de quatre personnes (en fait, c’était l’un des cas d’utilisation de son matériel marketing). J’ai appuyé sur l’agent Chatgpt sur le sujet.

Il m’a dit: «Je ne peux pas passer des commandes directement – je n’ai pas d’accès aux paiements ou de la possibilité de me connecter à des sites en tiers.» Lorsque je l’ai dit qu’il n’avait pas besoin de se connecter, il a dit qu’il ne pouvait pas saisir mes détails de facturation ou de paiement, soumettre un formulaire de commande en mon nom, ou «Accéder ou contrôler les sites Web externes, Même en mode invité.

L’agent de Chatgpt peut être impressionnant avec l’analyse, les options de pesage et vous guider à travers des actions, mais il ne semble pas pouvoir toujours livrer ce pour quoi il a été conçu: effectuer ces actions pour vous. Il est déclenché par le fait qu’il utilise son propre ordinateur, pas le vôtre, et cela limite considérablement son utilité. De plus, il peut facilement automatiser les parties plus intimes et amusantes du processus (choisir un bouquet spécifique, écrire une note sincère) mais a du mal à automatiser les pièces les plus frustrantes (remplissant en fait les détails de livraison et effectuer l’achat).

«Même avec votre permission, je n’ai pas la capacité technique à agir comme toi Sur un autre site – pas de saisie en votre nom, de cliquer sur les boutons ou de remplir les formulaires de carte de crédit “, a écrit l’agent de Chatgpt.” Considérez-moi davantage comme un assistant super puissant qui peut rassembler, comparer, écrire et guider – mais ne pas exécuter des transactions. “

Un de mes premiers emplois à New York était un assistant personnel, et je peux vous dire maintenant que j’aurais perdu mon emploi si je ne pouvais pas exécuter des transactions ou remplir des formulaires au nom de mon patron. L’agent Chatgpt est un pas en avant pour l’utilisation de l’IA quotidienne à certains égards, mais nous verrons s’il apprend à tenir ses promesses.

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button