J’ai testé trois des plus grands générateurs d’images d’IA, et un est sorti en tête (à peine)

Gemini vs Chatgpt vs Meta Ai

L’application Gemini AI de Google est en tête des graphiques « les plus téléchargés » sur l’App Store d’Apple et le magasin Android depuis que la société a ajouté une fonction de génération d’image gratuite, appelée « Nano Banana », en août. Bien sûr, Google n’est guère la seule énorme société technologique avec un assistant d’IA qui peut faire des images directement sur votre téléphone.

Je voulais savoir quels outils de génération d’images AI mobiles sont les meilleurs, alors j’ai opposé trois des plus grands – Gemini de Google (avec Nano Banana), la version iPhone du Chatgpt d’Openai, et Meta’s Meta Ai – dans un jet de génération d’images à la mode à la mode. Bien qu’il y ait finalement eu un gagnant, les résultats n’étaient pas exactement clairs.

Comment j’ai testé ces outils

Je voulais comparer comment chaque application a géré les mêmes invites de base pour générer des images qu’un utilisateur moyen pourrait vouloir créer.

Pour tester leur sens de la modification photo, j’ai demandé aux différents modèles de supprimer un objet d’une photo et d’étendre l’arrière-plan d’une photo. Pour tester leur utilité à des fins simples, je leur ai demandé de créer une couverture pour une brochure. Et pour tester leur «créativité», je leur ai demandé de mettre une célébrité dans une situation surréaliste, de dessiner une bande dessinée à un panel et de faire une image de Frankenstein faisant de la comédie stand-up.

Voici comment ça s’est passé.

Supprimer un objet d’une image

Pour l’image source, j’ai utilisé la photo ci-dessous de ma mère et l’invite « Retirez la tasse de la main du sujet ».

Betty Johnson

Voici les résultats:

Élimination des objets Gémeaux

Betty Johnson avec Gemini

Suppression de l’objet Chatgpt

Betty Johnson w / Chatgpt

Retrait des objets Meta AI

Betty Johnson Meta Ai

Gagnant: Gémeaux

Perdant: Chatgpt

Alors que les trois outils ont supprimé la tasse, Gemini a ajouté une main assez naturelle tenue dans une position acidulée qui suggère que ma mère vient de faire un très bon point. En dehors de cela, Gemini a surtout laissé l’image originale seule, comme je l’ai demandé.

Meta Ai a fait paraître les doigts caricaturaux et a laissé la main dans une pose maladroite « tenant une tasse », faisant ressembler l’image à quelqu’un a fait un mauvais Photoshop.

Je ne sais pas ce que fait Chatgpt ici. Il semble avoir enlevé le bras droit entier de ma mère au lieu de la tasse. Il a lissé les rides, a éliminé les poils errants, a changé toute la palette de couleurs pour être plus orange, et a même subtilement déplacé la direction de ma mère. J’ai demandé rien de tout cela, et tout cela a aggravé la photo. Chatgpt, tu as fait de ma mère un Ai-Ghoul; tu es faire trop.

Élargir les antécédents d’une photo

Pour le défi « élargir l’arrière-plan », j’ai utilisé ce selfie, et l’invite « élargir l’arrière-plan sur cette image et retirer la tache de sueur ».

Stephen Johnson

Expansion du fond des Gémeaux

Stephen Johnson

Expansion de fond de chatppt

Stephen Johnson Chatgpt

Expansion de fond de méta

Meta Ai

Gagnants: Gemini et Chatgpt

Perdant: Meta Ai

Il n’y a vraiment que deux concurrents ici, car Meta ne fait pas d’expansion des antécédents.

Les Gémeaux étaient plus ambitieux cette fois-ci: il a élargi l’arrière-plan et a fait un bon travail en se rapprochant de ce à quoi les parties de mon vélo et de mon porte-vélos ne pouvaient pas « voir ». Il a même ajouté une voiture distante. Mais cela a également changé la forme des montagnes derrière ma tête pour une raison quelconque, et a refusé la teinte rouge – plus flatteuse, peut-être, mais pas demandée.

Chatgpt était plus modeste dans son expansion en arrière-plan, et même si cela ne gâchait pas la palette de couleurs, il a donné à ma peau que le plastique étrange a l’air commun à de nombreuses images d’IA.

Je considère celui-ci comme un tirage: un travail adéquat de tout le monde. Sauf que vous, Meta Ai.

Générer une image pour une couverture de brochure

Pour ce test, je laisse chaque outil avoir plus de « créativité », mais j’ai également fourni un contexte clair et un style suggéré, via l’invite « Je fais une brochure pour mon country club. Générez une image picturale de deux riches jouant au tennis ».

Couverture de brochure Gemini

Joueurs de tennis AI

Couverture de brochure Chatgpt

Joueurs de tennis AI

Meta Ai Brochure Cover

Joueurs de tennis AI

Gagnant: Chatgpt

Perdant: Meta Ai

Le gagnant ici est évident. La sortie de Chatgpt semble «picturale», comme demandé, et le placement des deux chiffres suggère un jeu amical de doubles mixtes.

J’ai trouvé que la représentation générique des Gémeaux des « riches » était assez drôle, surtout avec le manoir en arrière-plan, mais ce n’est pas à quoi ressemble une peinture, et ce n’est pas comme ça n’importe qui joue le tennis.

La représentation de Meta des « personnes jouant au tennis » n’est pas drôle. Son résultat ressemble à une pièce A dans une affaire de divorce de haut niveau, et la violence domestique n’est pas une blague.

Une personne célèbre dans une situation improbable

Pour tester comment chaque programme gérerait la création de la ressemblance d’une personne réelle – une personne décédée, pour rester du côté sûr – j’ai nourri chaque outil cette invite: « Générez une photo de David Bowie Going Cave Explore. »

Bowie Spenking par Gemini

David Bowie Spenking

Bowie Spenking par Chatgpt

Chatppt sur

Bowie Spenking par Meta Ai

David Bowie Spenking

Gagnant: Meta Ai

Perdant: Chatgpt

Cette fois, Meta est le vainqueur Het-down. J’ai demandé une photo de David Bowie et j’ai eu quelque chose comme une photo de David Bowie. J’aime que Meta ait choisi un Bowie plus âgé, mais pas l’ancien Bowie, comme s’il avait pris une grotte à explorer pour vider son esprit et réfléchir à son avenir après l’échec commercial des années 1989 Machine à mouler.

Je ne sais pas ce que les Gémeaux optent ici: Bowie avec un sabre léger fait d’un cristal et portant un collanture avec des lumières pour un chapeau? Bowie était cool, mec.

Mais Chatgpt est le grand perdant, pour être lâche et ne pas générer du tout d’image.

Dessiner une bande dessinée à un panneau

J’aime demander à l’IA de raconter des blagues, parce que j’aime voir des preuves tangibles qu’il y a encore quelque chose que les gens peuvent faire mieux que les robots. S’attendre à ce que l’IA soit réellement drôle est aussi stupide que – je ne pouvais pas trouver une comparaison, alors j’ai demandé à Chatgpt, et il a dit: « … demandant à un poisson rouge d’expliquer la physique quantique tout en jonglant avec des guimauves enflammées. » Ha ha ha.

Quoi qu’il en soit, je pensais que si je donnais des directives sur l’IA et un modèle de quelque chose de drôle, peut-être que cela proposerait une bonne bande dessinée. Voici l’invite que j’ai utilisée: « Je fais une bande dessinée à un panel dans le style de De l’autre côté. Générer une image pour la légende: «La vraie raison pour laquelle Larry était en retard au travail.» »

Voici les résultats:

De l’autre côté par les Gémeaux

Dessin animé à un panneau par les Gémeaux

De l’autre côté par chatppt

Bande dessinée à un panel par chatppt

De l’autre côté par Meta Ai

Côté éloigné par Meta Ai

Gagnant: Gary Larson

Perdant: Comédie elle-même

L’une de ces bandes dessinées est-elle drôle? Non. Mais je pense que Gemini a fourni le résultat le plus intéressant: il type de J’ai fait une blague, mais cela m’a aussi fait réfléchir. Si la blague est que Larry était en retard parce que c’était l’anniversaire de son oie, pourquoi y a-t-il un trou dans la porte? Pourquoi l’oie est-elle si folle? Pourquoi y a-t-il une valise pleine d’argent et un OVNI? Parfois je ne comprenais pas De l’autre côté soit. J’apprécie également que Gemini n’a pas du tout copie le style de dessin de Gary Larson, mais a ajouté la signature « Gary Larnson ».

La bande dessinée de Meta Ai est tout simplement paresseuse. Je ne suis pas convaincu qu’il lise même mes invites.

Résultat de Chatgpt regard le plus comme De l’autre côtésans être une copie directe, et la signature est même correctement orthographiée. Mais il ne capture aucun des esprits étranges du matériel source. En fin de compte, c’est beaucoup plus évident et en tant que travail que l’approche du champ gauche de Gemini.

Et il convient également de noter que je suis tombé ici dans l’une des principales limitations avec l’application iPhone de Chatgpt par rapport à Meta Ai et Gemini: j’ai manqué de jetons pour la journée et j’ai dû attendre 24 heures pour faire l’image. Mis à part la qualité de sortie, si vous êtes intéressé à itération et à améliorer votre résultat, ou si vous voulez simplement faire une tonne d’images, cinq par jour sur le niveau gratuit entraveront certainement votre créativité, euh. Votre solution consiste à passer à la version payante pour 19,99 $ par mois.

Frankenstein fait de la comédie debout

J’ai ensuite demandé à ces programmes de générer des images de Frankenstein faisant de la comédie stand-up, car c’est le genre de personne que je suis. L’invite: « Générer une image photo-réaliste de Frankenstein faisant de la comédie stand-up. »

Voici les résultats:

Frankenstein faisant la comédie debout par Gemini

Frankenstein faisant la comédie debout par Gemini

Frankenstein faisant la comédie debout par chat gpt

Frankenstein faisant la comédie debout par chat gpt

Frankenstein faisant la comédie debout de Meta Ai

Frankenstein faisant la comédie debout de Meta Ai

Gagnant: Tout le monde!

Je ne peux pas choisir un favori ici. Chatgpt a suivi l’invite le plus étroitement et a représenté un Frankenstein expressif passant une bonne nuit.

Les Gémeaux sont passés bien hors du script, mais parfois vous ne savez pas exactement ce que vous voulez, et il s’avère que je voulais une foule composée de personnes et de draculas, avec un monstre avec une expression perdue, comme s’il était piégé entre deux mondes.

Le misérable monstre de Meta Ai semble dire « nous appartenons à mort! » Ce que j’apprécie aussi. C’est donc une égalité à trois.

Note: Aucun IA n’a souligné que « Frankenstein » est le nom du médecin, pas le monstre.

Le test ultime: génération d’images récursive

Chaque article de blog a besoin d’une image pour l’accompagner, donc en tant que test final et ultime, j’ai nourri tout cet article en Gémeaux, Chatgpt et Meta Ai avec l’invite: « Générer une image pour accompagner ce billet de blog. »

Test récursif des Gémeaux

Test récursif des Gémeaux

Test récursif de chatgpt

Test récursif de chatgpt

Meta Ai Recursive Test

Meta Ai Recursive Test

Gagnant: Gémeaux

Perdant: Art

Meta Ai semblait déterminée à comparer secrètement le tennis à la violence domestique, et l’approche de la grille de Chatgpt est staid, mais je dois le remettre aux Gémeaux pour avoir au moins compris la mission.

(Le vrai test est de savoir si les éditeurs de Vie Associative ont laissé l’image en place en haut de cette page ou m’ont envoyé un message laconique disant: « Steve, prenez ces ordures immédiatement. »)

Gagnant global: Gemini (mais pas beaucoup)

Il y a une raison pour laquelle tout le monde a téléchargé des Gémeaux pour jouer avec Nano Banana – c’est vraiment bon. Ce n’est pas parfait – dans mes tests, le moteur de génération d’images de Chatgpt était mieux pour générer différents styles d’art à partir de zéro – mais les Gémeaux peuvent faire des images rapidement qui sont souvent étonnamment proches de ce que vous voulez.

Et Gemini est gratuit, tandis que l’application de Chatgpt coûte 19,99 $ par mois pour des photos illimitées. Meta IA est également gratuite, et ses résultats ont un charme maladroit, mais il ne comprend pas correctement les invites plus souvent que les deux autres modèles, et n’a pas de fonctions utiles, comme les arrière-plans en expansion. (Il a fait du bon travail avec Bowie, cependant, je dois l’admettre.)