Vous pouvez désormais payer 200 $ par mois pour un ChatGPT « raisonnant »

OpenAI o1 est enfin hors de préversion.

Payeriez-vous 200 $ par mois pour ChatGPT illimité ? Et s’il était capable de « raisonner » ? OpenAI pense que vous pourriez le faire.

Dans le cadre de ses « 12 jours de Shipmas », au cours desquels la société annonce de nouvelles fonctionnalités pendant 12 jours consécutifs, OpenAI sort enfin son premier modèle de raisonnement de l’aperçu, et ajoute un accès illimité à celui-ci et à tous les modèles OpenAI à 200 $. plan d’abonnement mensuel.

Appelé OpenAI o1, le modèle de raisonnement est disponible en avant-première depuis septembre, les membres payants de ChatGPT pouvant envoyer 30 messages par semaine à o1-preview et 50 messages par semaine à o1-mini, plus léger. Maintenant qu’il est en version complète, comme l’a expliqué le PDG Sam Altman lors d’un livestream aujourd’hui, les membres de Plus et de l’équipe seront toujours limités dans la quantité qu’ils peuvent utiliser (les membres d’Enterprise et d’Edu devront également attendre une semaine pour y accéder), mais ce sera censé être beaucoup plus puissant quand ils le feront.

Qu’est-ce qu’un modèle d’IA de raisonnement ?

L’un des plus gros problèmes liés à l’IA est l’hallucination, ou tout simplement le fait que quelque chose ne va pas. Parce qu’un chatbot IA ne peut compter que sur sa formation, il ne peut normalement pas dire ce qui est réel et ce qui ne l’est pas, et présentera des mensonges avec la même confiance que les faits.

Reasoning AI est une tentative de résoudre ce problème. Avec un modèle de raisonnement, une IA décomposera une invite en plusieurs parties, abordant chacune d’elles à la fois et faisant de son mieux pour vérifier l’exactitude de ses conclusions antérieures avant de passer à autre chose, tout en vous montrant son processus de réflexion. La réponse peut également prendre plus de temps que votre modèle habituel, afin d’éviter les erreurs.

C’est ce qu’on appelle la « chaîne de pensée » et, en testant o1-preview et 01-mini, l’éditeur de Vie Associative, Jake Peterson, a eu de la chance avec des invites simples (un hot-dog est-il un sandwich ?) et des invites plus complexes (générer un puzzle de nonogrammes 6×6 qui ressemble à la lettre Q une fois résolu). La première version du robot prenait plus d’une minute pour générer des réponses lorsque cela était nécessaire et lui fournissait un menu déroulant lui permettant de faire défiler son « processus de réflexion ».

Cela garantissait que lui et le bot pouvaient facilement déboguer et comprendre d’où provenaient les erreurs, et avec le modèle o1 final, OpenAI promet qu’il a réduit de 34 % « les erreurs majeures sur des questions difficiles du monde réel » et que le modèle est généralement maintenant « environ 50 % plus rapide ».

Graphiques ChatGPT o1

En particulier, OpenAI a publié des graphiques promettant que le nouveau modèle est plus de 50 % plus fiable que le modèle GPT-4o sans raisonnement en matière de codage et plus de 40 % plus fiable en mathématiques de compétition. Ce sont tous des chiffres internes, et OpenAI n’a pas été très clair sur la manière dont il teste ou mesure ces modèles, mais ce sont de très grandes vantardises.

Il faudra probablement un certain temps aux experts pour effectuer leurs propres tests indépendants, il est donc possible que vous voyiez bientôt un peu d’eau froide jetée sur ces affirmations. Une étude récente d’Apple, par exemple, a révélé que les capacités de « raisonnement » de o1 s’apparentent encore davantage à une « correspondance de modèles sophistiquée ».

Payeriez-vous 200 $ pour ChatGPT ?

C’est là que le problème entre en jeu. OpenAI dit en fait qu’il dispose d’une meilleure version de o1, mais son prix est élevé. ChatGPT Pro a été annoncé aux côtés d’OpenAI o1, un nouveau plan d’adhésion qui donne un accès illimité à tous les modèles OpenAI et déverrouille le « mode pro » d’o1.

« Dans les évaluations réalisées par des testeurs experts externes, le mode o1 pro produit des réponses plus précises et plus complètes, en particulier dans des domaines tels que la science des données, la programmation et l’analyse de la jurisprudence », a écrit OpenAI dans un article de blog.

Métriques ChatGPT Pro

Essentiellement, le mode Pro permet au modèle d’utiliser plus de calcul et de prendre plus de temps, ce qui entraîne un peu plus de 10 % de fiabilité en plus en fonction de la tâche. Est-ce que ce petit peu de performance supplémentaire en vaut la peine ? Eh bien, cela pourrait être le cas si vous êtes un chercheur médical ou un autre utilisateur expérimenté, c’est probablement la raison pour laquelle OpenAI accorde 10 subventions aux « principales institutions aux États-Unis », ce qui leur donnera un accès gratuit à ChatGPT Pro.

Tout le monde devra décider jusqu’où il souhaite étendre son portefeuille, bien qu’OpenAI ne cible pas ici strictement les entreprises clientes, l’annonce en direct indiquant que le mode o1 pro cible également les « utilisateurs expérimentés » qui « poussent déjà les modèles vers les limites de leurs capacités dans des tâches comme les mathématiques, la programmation et l’écriture.

À quoi ressemble l’avenir de ChatGPT ?

Même si OpenAI o1 sera probablement un peu prohibitif pour la plupart des gens pour le moment, même s’ils ne regardent pas son mode pro (ChatGPT Plus coûte toujours 20 $ par mois), la société a déclaré qu’elle cherchait à améliorer la convivialité du modèle pour « cas d’utilisation quotidiens » au-delà des « problèmes de mathématiques et de programmation vraiment difficiles ». Dans le cadre de la version d’aujourd’hui, le modèle est désormais censé répondre à des questions simples « très rapidement », tout en prenant plus de temps pour les questions plus difficiles, au lieu de s’attarder sur toutes les requêtes.

Avec cela, OpenAI ouvre la voie à o1 pour potentiellement remplacer ses modèles sans raisonnement sur toute la ligne. Cela pourrait être une grande aubaine pour les utilisateurs gratuits, même si cela ne devrait pas se produire de si tôt.

Entre-temps, des sources ont déclaré à The Verge qu’elles s’attendaient à ce que Sora, le modèle texte-vidéo d’OpenAI, soit publié lors de l’événement « 12 jours de Shipmas ».