Pendant le plus longtemps, la génération d’images était l’un des rares domaines où les Gémeaux avaient un avantage sur le chatppt. Le modèle Imagen de Google a généré des images plus réalistes et a suivi des invites mieux, tandis que Dall d’Openai ait souvent produit des images qui semblaient plus AI et caricaturales. Mais c’est sur le point de changer.
Désormais, Google et Openai déploient des générateurs d’images natifs alimentés par leurs modèles d’IA multimodaux. Alors que la version de Gemini est toujours cachée dans AI Studio – la plate-forme de test bêta de Google – Openai a publié son générateur d’images natif directement à l’intérieur de Chatgpt.
Voici la torsion. La version de Gemini est disponible gratuitement pour tout le monde, tandis que OpenAI a retardé le déploiement des utilisateurs gratuits en raison d’une demande excessive. J’ai essayé les deux. Et disons simplement que les tables peuvent tourner.
1. Changer le style d’une image
L’un des plus grands avantages de la génération d’images natifs est qu’il ne s’agit pas seulement de créer des images à partir de zéro – il est également excellent pour éditer ou transformer des images existantes. Après que Chatgpt ait déployé cette fonctionnalité, X a été inondé d’images de style anime inspirées par Studio Ghibli. J’ai donc décidé d’essayer la même chose. J’ai téléchargé une photo d’un gars à la fois dans le chatte et les Gémeaux, leur demandant de le convertir en style anime ghibli. Voici ce que j’ai:
Disons simplement cela clairement: Gemini a du mal à changer complètement le style. Il s’en tient principalement à l’image d’origine, augmentant souvent la luminosité, quelle que soit ce que vous demandez. En revanche, Chatgpt transforme l’image – style anime, art pixel, personnages LEGO, Simpsons, animation de style pixar 3D, vous l’appelez. Bien qu’il modifie quelques détails, en particulier les visages, le résultat global est des kilomètres d’avance sur les autres modèles.
Verdict: Seul le chatppt peut transformer entièrement une image en un style différent. Le générateur d’images natif de Gemini échoue actuellement
2. Édition de petits changements au-dessus de l’image
C’est là que Gemini brille. J’ai téléchargé la même image sur les deux modèles et leur ai demandé d’ajouter des lunettes. Voici ce qui s’est passé:
Les deux ont fait le travail, mais de différentes manières. Chatgpt a tendance à redessiner toute l’image, parfois même modifiant le visage de la personne. En revanche, Gemini ajoute simplement les lunettes sans toucher autre chose. En effet, Chatgpt génère toujours une nouvelle image basée sur l’original, tandis que Gemini peut effectuer des modifications en plus de l’original. De même, vous pouvez également supprimer des objets, etc. en Gémeaux. Les gens utilisent déjà cette fonctionnalité pour éliminer les filigranes et divers trucs fous.
Verdict: Gemini gagne si vous voulez des modifications propres sans changer l’image d’origine.
3. Génération d’une image réaliste à partir de zéro
C’était un point faible pour Chatgpt, mais plus. J’ai demandé aux deux modèles de générer un gros plan d’un vieil homme dans les années 70, portant un cardigan en laine douce sur une chemise blanche. Voici ce qu’ils ont trouvé:
Les deux ont cloué l’invite et sont à peu près à égalité. L’image de Chatgpt est légèrement plus polie, tandis que la version de Gemini semble plus réaliste, capturant des imperfections de caméras subtiles et un look naturel. Chatgpt, en revanche, penche vers la perfection – presque trop parfait parfois. Cependant, en choisir l’un plutôt que les autres peut être une préférence personnelle.
Verdict: Les deux modèles peuvent générer facilement des images réalistes.
4. Mélanger deux images en une
Chatgpt et Gemini vous permettent désormais de télécharger plusieurs photos de référence pour générer une nouvelle image. Dans ce test, j’ai téléchargé une photo d’un homme et une image séparée d’un autre homme portant une chemise verte. Enfin, les deux modèles ont demandé à générer une image du premier homme portant la chemise verte. Voici ce que j’ai:
Chatgpt offre toujours de bons résultats. Les Gémeaux, cependant, ignorent parfois la tête ou publient une image de basse qualité, mais ces problèmes disparaissent généralement avec une ou deux réessayer. D’un autre côté, Gemini cloue la couleur de la chemise plus précisément, tandis que Chatgpt introduit une légère variation.
Verdict: Chatgpt gagne pour la cohérence et la qualité globale. Mais Gémeaux n’est pas loin derrière
5. Générer une image avec un point de vue différent
Chatgpt et Gemini peuvent également générer des images d’un point de vue différent. Pour ce test, j’ai téléchargé une photo de l’intérieur d’un train et j’ai demandé aux deux modèles de recréer la scène du côté opposé.
Les deux ont fourni des résultats décents mais ont lutté avec le placement des objets, en particulier dans des images complexes avec de nombreux éléments. Cela dit, si suivre de tels détails n’est pas important et que vous cherchez simplement une nouvelle perspective d’un sujet – comme une voiture ou un bâtiment – les modèles le gèrent bien.
Verdict: Les deux modèles ont fait un travail décent mais ont gâché le placement des objets.
6. Génération d’une carte d’anniversaire
Ces nouveaux modèles seraient également bien meilleurs pour générer des images avec du texte – une tâche avec des modèles plus anciens a souvent eu du mal. J’ai donc décidé de tester cela en générant une carte d’anniversaire avec un texte spécifique.
Étonnamment, les deux modèles l’ont cloué. Ils ont suivi l’invite exactement – en utilisant un texte cursif «joyeux anniversaire» et l’entourant des dessins floraux, comme demandé. Lequel a l’air mieux est vraiment une question de goût personnel. Nous avons également essayé de générer des menus, des pancartes, des infographies et d’autres images de texte – et les deux modèles les ont assez bien gérés.
Verdict: Gemini et Chatgpt peuvent désormais générer du texte précis et lisible dans les images et suivre de près.
Générateur d’images natif de Chatgpt vs Gemini
Dans tous nos tests, quelques modèles se sont démarqués. Chatgpt fournit systématiquement des images de meilleure qualité – des détails plus nets, une meilleure composition et moins d’artefacts étranges. Avec les Gémeaux, vous devez souvent vous régénérer plusieurs fois avant d’atterrir sur quelque chose de bien. Cela dit, les Gémeaux sont sensiblement plus rapides. Il peut produire une image en environ 10 secondes, tandis que Chatgpt peut parfois prendre une minute ou plus, même pour des invites simples.
Lorsqu’il s’agit de générer des visuels réalistes, de gérer du texte dans des images ou de changer de perspective, les deux modèles fonctionnent de manière similaire. Mais la vraie différence apparaît lors des modifications. Chatgpt est bien meilleur pour transformer le style global d’une image, tandis que Gemini brille lorsque vous souhaitez ajouter ou supprimer des objets spécifiques sans rien changer d’autre.
Dans l’ensemble: Chatgpt offre une qualité plus cohérente et une meilleure expérience polyvalente – si cela ne vous dérange pas d’attendre.