Claude s’est toujours concentré sur le texte et le code, mais il a déployé il y a quelques jours des capacités de génération d’images, des moyens d’obtenir des graphiques, des maquettes, des diaporamas et d’autres matériaux similaires créés par l’IA. La suite d’outils s’appelle Claude Design.
Puis ChatGPT, déjà beaucoup plus investi dans la génération d’images IA, a déployé une mise à jour substantielle appelée Images 2.0. Des promesses ont été faites d’un « changement progressif » en termes d’exactitude, de cohérence et de suivi des instructions.
Alors, que pouvez-vous maintenant faire avec ces outils d’IA que vous ne pouviez pas faire auparavant ? Et comment les capacités se comparent-elles ?
Claude Design se concentre sur les affaires et l’entreprise
Claude Design est disponible pour les abonnés Claude et est destiné, selon les mots d’Anthropic, à « des travaux visuels tels que des conceptions, des prototypes, des diapositives, des pages d’une page, et plus encore ». Il ne produira pas pour vous des images de chats faisant du skateboard, mais il volonté créez un diaporama de projet ou une maquette d’une application iPhone.
Cela poursuit l’accent mis par Claude sur les affaires et l’entreprise : en plus de coder avec Claude, les équipes peuvent élaborer des prototypes et assembler des pitch decks. Cela peut sembler un peu sec, mais les nouvelles fonctionnalités sont en réalité assez polyvalentes et incluent des globes interactifs rotatifs, comme le montre la vidéo de démonstration.
Crédit : Vie Associative
Pour commencer, vous pouvez demander à Claude de créer des visuels à partir d’une base de code existante, de charger des images et des documents existants à utiliser comme points de départ, ou simplement de taper une invite de texte. Vous devez vous diriger vers une page de destination spéciale de Claude Design, distincte de l’interface principale du chatbot, qui vous permet de choisir comment vous souhaitez que votre flux de travail fonctionne.
J’ai décidé de créer une présentation de diapositives montrant la valeur de Vie Associative et j’ai donné à l’IA quelques captures d’écran avec lesquelles travailler pour avoir une idée du style. Claude m’a ensuite posé quelques questions sur ce que je souhaitais, notamment le mélange de texte et d’images, et la durée du diaporama, avant de se mettre au travail. Vous pouvez voir l’IA « penser » et suivre les étapes de création des graphiques en temps réel.
Lorsque le travail fini a été présenté, il était incroyablement peaufiné et Claude Design vous offre tout ce dont vous avez besoin pour exporter votre travail ailleurs. L’une des fonctionnalités les plus utiles est la façon dont vous pouvez modifier les visuels après leur création. Sur mon diaporama, j’ai pu modifier la couleur d’accent, les polices et la densité des diapositives en quelques clics.
Crédit : Vie Associative
Vous pouvez également demander des modifications via d’autres invites et même vous appuyer sur les visuels pour indiquer ce qui devrait se passer ensuite. Passant à une maquette iPhone d’une potentielle application d’actualités Vie Associative, Claude Design a fait un excellent travail ici aussi, à l’exception d’un ou deux petits problèmes graphiques : le design de l’application qui avait l’air très Vie Associative, et j’ai pu demander des modifications simplement en dessinant sur les visuels et en tapant ce que je voulais changer.
Tout est élégant, professionnel et facile à déplacer ; J’ai pu voir beaucoup d’entreprises utiliser Claude Design aux côtés de Claude Code. Pour les particuliers, cela semble être un moyen utile de rassembler des idées pour concevoir à peu près tout, y compris des diaporamas (bien que les outils d’IA contenus dans des applications comme PowerPoint et Google Slides puissent mieux vous convenir).
ChatGPT Images 2.0 est axé sur l’utilisation par les consommateurs et les entreprises
Quant à ChatGPT et sa mise à niveau Images 2.0, il est beaucoup plus généralisé et axé sur une utilisation grand public comme professionnelle. OpenAI affirme que les instructions rapides sont désormais plus suivies de près, que les résultats finaux sont plus précis et cohérents et que le rendu du texte a été encore amélioré. Les tâches peuvent être plus complexes et les images semblent également plus « conçues intentionnellement ».
Créer des images est aussi simple que toujours : il suffit de cliquer Créer une image et expliquez ce que vous voulez voir dans la zone d’invite. Les gens ont complexifié Où est Waldo ? des images, des infographies provenant d’articles scientifiques et des couvertures de magazines simulées ; J’ai pu produire une bande dessinée rapide sur Vie Associative en quelques minutes.
Crédit : Vie Associative/ChatGPT
ChatGPT s’est également avéré capable de simuler deux couvertures du magazine Vie Associative, de qualité variable : elles semblent certainement assez réalistes, et il n’y a pas d’erreurs ou de fautes de frappe évidentes, mais en même temps, elles ont également cette sensation générique qui accompagne de nombreuses images d’IA. Vous pouvez dire que ces couvertures représentent la « moyenne » de toutes les couvertures de magazines aspirées dans les données de formation de ChatGPT.
Crédit : Vie Associative/ChatGPT
Vous ne pouvez pas créer de présentations de diapositives ou quoi que ce soit d’aussi complexe que dans Claude Design avec ChatGPT Images 2.0. Vous pouvez théoriquement créer des diapositives uniques et des maquettes d’applications, mais il existe de nombreuses autres limitations en termes de cohérence et de modification de ce qui est à l’écran par la suite : ChatGPT concerne bien plus des moments ponctuels d’art de l’IA.
Le nouveau modèle Images 2.0 est également bien meilleur pour extraire des informations réelles du Web, vous pouvez donc créer une carte dessinée de la Terre du Milieu (bien qu’elle soit suffisamment respectueuse des droits d’auteur pour ne pas faire une copie exacte du travail de Tolkien), ou créer un diagramme informatif sur les tournois sportifs à venir. J’ai effectué ces deux tests et ChatGPT a obtenu des résultats visuels impressionnants.
Plutôt que ChatGPT, la comparaison la plus proche avec Claude Design est probablement les outils Gemini AI disponibles via Google Docs, Sheets et Slides, dont j’ai déjà parlé. Bien que vous ne puissiez pas encore créer des présentations entières, vous pouvez créer des diapositives à partir d’invites simples et charger d’autres documents comme références pour la conception.
Comme avec Claude Design, vous pouvez utiliser des invites de suivi pour affiner certains aspects de la conception du diaporama ou du document, sans avoir à recommencer depuis le début. Et votre travail terminé peut être exporté dans une variété de formats, y compris les types de fichiers PDF et compatibles Microsoft Office.