DALL-E 2
Dall-E 2 : Le test complet
Dall-E 2 est la deuxième version du générateur d’images basé sur l’intelligence artificielle développé par OpenAI, l’éditeur de ChatGPT, qui permet de créer des images inédites à partir d’une description texte, ou d’une image existante.
Que peut-on faire avec cet outil ? Comment l’utiliser ? Quelles sont ses qualités et ses limites ? Combien ça coûte ? Vous trouverez les réponses à toutes ces questions au cours de ce test, et bien d’autres infos. Bonne lecture !
Présentation et historique de Dall-E
Le nom « Dall-E » est un clin d’œil à Salvador Dalí, le célèbre peintre surréaliste, et WALL-E, le robot du film d’animation éponyme. L’idée derrière ce projet était de créer un modèle capable de générer des images cohérentes et créatives à partir de simples descriptions textuelles. Pour y parvenir, les chercheurs d’OpenAI ont combiné les avancées réalisées dans le domaine du traitement automatique du langage naturel (NLP) avec celles effectuées dans celui de la génération automatique d’images.
La première version de Dall-E été présentée au public en janvier 2021. Elle repose sur un moteur d’analyse de type GPT3 avec 12 milliards de paramètres pour interpréter les requêtes des utilisateurs, et un réseau neuronal de classification d’images baptisé CLIP (Contrastive Language–Image Pre-training) qui permet de reconnaître les objets présents sur une image et les associer au texte.
Dall-E 2 a été présenté au grand public en avril 2022, et apporte plusieurs améliorations notables au premier modèle, notamment une définition des images 4 fois plus élevée, une capacité de génération des images plus photoréalistes, et l’ajout d’un éditeur pour modifier les images générées.
Qui utilise Dall-e 2 et pourquoi ?
A l’instar de MidJourney, Stable Diffusion et des autres IA génératives, Dall-E s’adresse à toutes les professions liées au graphisme, à la photographie et à l’édition. L’outil permet de générer en quelques secondes des images qu’un graphiste aurait mis plusieurs heures à réaliser, et de générer des photos improbables qu’un photographe n’aurait peut être jamais pu capturer dans la vraie vie. Sans compter tout ceux qui, bien que doués de beaucoup d’imagination, n’ont pas les talents suffisants pour réaliser eux-même les visuels qu’ils ont en tête.
Voici une liste non-exhaustive de tous les types de visuels qu’il est possible de créer avec Dall-E :
Pour les graphistes et le webdesign
- Création de logos et d’identités visuelles : Les entreprises pourront faire appel à Test Dall-e 2 pour concevoir des logos et des éléments graphiques qui correspondent parfaitement à leur image de marque et à leurs valeurs.
- Réalisation de maquettes et de prototypes : Les designers pourront tester rapidement différentes hypothèses et obtenir des aperçus visuels avant de se lancer dans la réalisation finale de leurs projets.
- Réalisation d’œuvres d’art numériques : une nouvelle génération d’artistes numériques est née avec l’avènement des IA génératives et des NFT. Dall-E leur permet de réaliser des créations graphiques s’inspirant du style d’artistes connus, ou combinant plusieurs styles, pour créer de nouveaux courants artistiques.
Dans l’édition web et la presse
- Génération d’images d’illustration : Les éditeurs de contenus web, blogueurs, journalistes et influenceurs pourront facilement créer des visuels sur mesure avec Dall-E, afin d’illustrer leurs articles, posts de blog et publications sur les réseaux sociaux.
- Création de visuels engageants : Les professions du webmarketing et les influenceurs sont toujours à la recherches d’images pour faire le buzz, et générer de l’engagement chez les internautes. Les IA génératives telles que Dall-E sont parfaitement adaptées à la création de tels contenus.
Pour les photographes
- Création de photos inédites : Dall-E 2 permet d’ouvrir de nouvelles perspectives aux photographes, en générant des visuels photoréalistes qu’ils n’auraient jamais pu prendre en photo dans la vraie vie.
- Création d’images composites : Dall-e 2 peut être très utile pour les photographes qui souhaitent créer des images composites complexes. Par exemple, ils peuvent utiliser Dall-E 2 pour ajouter des éléments supplémentaires à leurs photos tels que des animaux, des objets ou des personnes.
Dans l’industrie du jeu vidéo
- Conception de personnages et d’univers : Les développeurs de jeux vidéo pourront utiliser Dall-E 2 pour créer des personnages et des décors originaux qui enrichissent l’expérience de jeu et trouver de l’inspiration pour enrichir leurs univers graphiques.
Comment fonctionne Dall-E 2 ?
Mode opératoire
Pour générer des images à l’aide de Dall-E 2, il faut au préalable créer un compte sur OpenAI. Si vous utilisez déjà ChatGPT, vous en avez déjà un, il ne sera pas utile d’en créer un autre. Sinon c’est très simple, vous pouvez vous inscrire avec votre adresse email ou bien votre compte Google ou Microsoft.
Contrairement à Midjourney, Dall-E 2 ne nécessite pas de passer par Discord, la génération des images s’effectue directement sur le site d’OpenAI Labs.
L’interface graphique de Dall-eE2 est plutôt simple et intuitive. Un champ de texte en haut de l’interface permet de saisir la description de l’image souhaitée (prompt), et en validant la saisie, une série de 4 images est générée en quelques secondes, et s’affiche juste en dessous.
Pour chacune de ces images, il est possible d’effectuer plusieurs actions :
- Générer des variations : Cette option lance la génération de 4 nouvelles images qui seront fortement inspirées de l’image sélectionnée. Une solution intéressante pour trouver l’image idéale à partir d’une image qui s’en approche. Attention cependant, un crédit sera déduit de votre compte chaque fois que vous ferez appel à cette fonction.
- Éditer l’image : Cette fonctionnalité permet de modifier l’image dans un éditeur, qui permet de supprimer des éléments que vous souhaitez supprimer ou remplacer sur l’image. Un outil « gomme » vous permet de sélectionner les éléments à effacer, et un champ de texte vous permet de rédiger un prompt pour décrire les éléments que l’AI doit générer pour compléter l’image.
- Télécharger l’image : Si vous êtes satisfait d’une image, vous pourrez télécharger cette image en haute définition sur votre ordinateur, smartphone ou tablette, et l’utiliser ensuite dans vos créations, vos publications ou encore la retoucher avec un logiciel d’édition tel que Photoshop ou The GIMP.
Sur la partie de droite, se trouve l’historique de vos images générées, et vous pouvez les revoir et les retélécharger, ou les réutiliser comme base pour générer de nouvelles images.
Construction du prompt
La description de l’image, ou prompt, et l’élément central qui permet de contrôler l’IA et d’obtenir les images que l’on souhaite. Chaque IA a une manière différente d’analyser un prompt, et il faudra un peu de temps et de pratique pour parvenir à réaliser des images conformes à vos attentes sur Dall-E.
L’anatomie du prompt peut être divisée en plusieurs parties, qui auront chacune un impact sur l’image générée :
- Le sujet : Il s’agit du thème principal ou du personnage central de l’image.
- Les adjectifs : Ils permettent d’ajouter des caractéristiques spécifiques au sujet (couleur, taille, émotion, style…).
- Le contexte : Il décrit le cadre dans lequel le sujet doit être intégré (environnement, action…).
En combinant ces différents éléments dans un prompt bien structuré et précis, il devient possible d’influencer très finement les images générées par Dall-E 2. On peut très bien obtenir des images très satisfaisantes avec un prompt court qui se limite à décrire le sujet, mais le résultat sera forcément plus aléatoire.
Créer une image à partir d’une image existante
Dall-E 2 permet d’utiliser une image existante comme point de départ pour créer une nouvelle image. Pour ceci, il suffit de téléverser (upload) une image existante, et de sélectionner la zone que l’on veut conserver. A partir de là, deux possibilités s’offrent à vous :
- Soit lancer directement la génération de variations de l’image, sans aucune instruction particulière. L’intelligence artificielle va alors générer 4 variations de l’image que vous avez fournie.
- Soit passer en mode édition, comme décrit plus haut (voir « Éditer image ») ce qui permet de préciser à Dall-E ce que l’on veut conserver et ce que l’on veut ajouter ou changer sur l’image (via le prompt).
- Soit utiliser le mode « outpainting » de Dall-E 2 pour prolonger et compléter votre image. Astuce : vous pouvez redimensionner au préalable l’image dans un canvas plus grand avec un fond transparent, à l’aide d’un logiciel comme Photoshop ou The GIMP (gratuit) ou encore le service Photopea.com. Cela permettra de demander à Dall-E de générer tout l’espace transparent avec les instructions fournies dans le prompt.
Ces fonctionnalités d’édition d’image, qui sont en annoncées en beta test, nous semblent particulièrement intéressantes et prometteuses dans les usages qu’elles pourraient offrir. Malheureusement, les résultats sont assez aléatoires, et les éléments ajoutés à l’image sont souvent intégrés de manière peu harmonieuse. Et surtout, chaque fois que vous lancez une génération, même lorsque le résultat est complètement raté et que vous le rejetez (il y a un bouton pour cela), cela vous coûte un crédit…
Qualité des images générées par Dall-E
Nous avons lu beaucoup d’éloges sur Dall-E, et vu beaucoup de comparatifs qui plaçaient les résultats de cette IA générative au-dessus de ceux obtenus avec midjourney. Chez DirectIA, nous ne sommes pas partisans et n’avons aucun a-priori sur un outil ou un autre, mais en nous fiant à notre expérience, nous ne dressons pas un constat aussi positif des résultats produits par Dall-E 2.
Pour commencer, le serveur est souvent saturé de demandes, et si on a le malheur de tomber sur un moment de forte charge, il faut relancer plusieurs fois chaque demande pour qu’elle finisse par aboutir. Cela est probablement lié à un grand nombre d’utilisateur désireux de tester le service, surtout depuis que le principal concurrent (Midjourney) n’offre plus de test gratuit. Mais contrairement à la plupart de ses concurrents, Dall-E ne semble pas avoir de gestion de file d’attente : soit la requête est traitée dans les 10 secondes, soit elle échoue avec un message d’erreur indiquant que le service est saturé…
De plus, il nous a été très difficile d’obtenir des résultats corrects. La majorité des images générées présentaient de nombreuses aberrations graphiques, notamment sur les mains, et sur les jointures de textures ou encore les fonds. Nous avons également eu beaucoup de mal à obtenir le cadrage souhaité, même en fournissant des instructions sur le cadrage, ou l’objectif photo souhaité.
Et même lorsque nous avons obtenu des aperçus qui semblaient corrects, les images téléchargées en haute définition présentaient un niveau de précision inférieur à ce que nous avions constaté lors de nos essais sur des solutions concurrentes. Exemple :
Il est très probable que nous avons pas suffisamment de pratique et de maîtrise du prompt de Dall-E pour générer des images à la hauteur de nos attentes. Il est certain que c’est possible puisque certains ont pu générer de superbes images avec le service d’OpenAI, et nous en voulons pour preuve les images ci-dessous qui ont été générées avec Dall-E 2.
Ces exemples montrent qu’il est possible d’obtenir des visuels très beaux et créatifs, dans une grande variété de styles graphiques et artistiques, et avec un rendu net et de qualité avec Dall-E 2.
Tarifs de Dall-E 2
Essai gratuit
Dall-E vous offre 15 crédits gratuits chaque mois, ce qui permet de lancer 15 générations. C’est peu, mais cela permet de tester le service.
A savoir : si vous n’utilisez pas vos crédits gratuits dans le mois, ils ne sont pas reportés le mois suivant.
Acheter des crédits
Dall-E 2 ne propose pas d’abonnement mensuel ni annuel. Si l’on souhaite utiliser Dall-E 2 au-delà des 15 crédits gratuits mensuels, il faut acheter des packs de crédits. Le tarif est de 15$ pour 115 crédits, ce qui revient à 13 cents par génération.
La durée de validité des crédits achetés est de 12 mois, et il n’y a pas de discount au volume : si vous achetez 1150 crédits, il vous en coûtera 150 €.
A titre de comparaison, l’abonnement mensuel de base sur Midjourney coûte 10$ / mois pour environ 200 générations d’images (et même beaucoup plus en jouant sur les paramètres de qualité). Ce qui équivaut à 5 cents par image, sous réserve d’utiliser tout son crédit chaque mois.
Générer des images avec Dall-e 2 revient donc plus cher « à l’unité », mais son système de crédits est plus adapté à ceux qui ont des besoins réduits ou irréguliers. Par exemple, si vous avez besoin de générer quelques images par semaine, vous pourrez tenir plusieurs mois avec les 115 crédits à 15$.
Conclusion
Dall-E 2 est sans conteste l’une des IA génératives d’images les plus abouties, et constitue une véritable vitrine technologique du savoir-faire OpenAI. L’outil permet de créer de superbes images, pour peu que l’on parvienne à bien le prompter (il y a fort à parier que ce verbe finira dans le langage courant d’ici quelques mois à quelques années !). Et surtout, son mode d’édition d’images et sa fonctionnalité d’outpainting apportent une touche d’innovation et permettent de nouveaux cas d’usages particulièrement intéressants.
Mais dans le domaine de l’intelligence artificielle, tout va très vite, et si OpenAI a su imposer ChatGPT comme la référence mondiale en matière d’IA conversationnelle, Dall-E 2 reste selon nous un cran en dessous de son principal concurrent Midjourney, en termes de rendu et d’interprétation des prompts. En particulier depuis Midjourney 5, qui corrige beaucoup des défauts communs aux deux IA, notamment la difficulté à représenter certains éléments tels que les mains.
Mais il ne faut pas oublier que Dall-E 2 date maintenant de près d’un an, alors que Midjourney 5 n’a que quelques semaines d’existence au moment où nous rédigeons ce texte. Il y a fort à parier que la prochaine version, Dall-E 3, est déjà sur les rails, et devrait nous en mettre plein la vue et peut-être reprendre l’avantage. Nous sommes impatients…
Specification: DALL-E 2
|
User Reviews
Be the first to review “DALL-E 2” Annuler la réponse
You must be logged in to post a review.
- Interface utilisateur pratique et simple d'utilisation
- Fonctionnalités innovantes (édition d'image, outpainting)
- 15 images gratuites par mois
- Tarification souple (crédits valables 1 an)
- Serveur souvent saturé
- Images générées parfois décevantes
- Peu de ressources d'aide ou de support
- Prix des crédits assez élevé
There are no reviews yet.