DALL-E 3 : outil amélioré de génération d'images basé sur l'IA d'OpenAI qui intègre ChatGPT
OpenAI présente DALL-E 3, une version avancée de son créateur d'images IA qui intègre son chatbot populaire, ChatGPT.

OpenAI, leader de l'intelligence artificielle avancée, annonce l'introduction de sa version améliorée DALL-E 3. Cette version avancée de l'outil de conversion texte-image de l'entreprise intègre ChatGPT, le chatbot IA répandu d'OpenAI, pour rationaliser et modifier le processus d'invite d'image.
Les principaux outils de génération d’images basés sur l’IA et opérationnels à l’heure actuelle transforment les invites ou les descriptions d’images en une gamme d’œuvres d’art aux styles multiples, du photoréaliste au fantastique. Cependant, le défi réside dans le développement d'une invite adaptée, ce qui a stimulé l'émergence de « l'ingénierie de l'invite » en tant que profession louable.
DALL-E 3 révolutionne ce processus en implémentant ChatGPT pour aider à améliorer les invites. Les abonnés à ChatGPT Plus et ChatGPT Enterprise peuvent tirer parti de cet outil en soumettant leurs demandes d'images et en les affinant grâce à des discussions avec le chatbot. Ce faisant, ils reçoivent les résultats affinés directement dans l’application de chat.
ChatGPT a la capacité d'étendre les invites aussi courtes que quelques mots, les rendant plus descriptives et fournissant des instructions améliorées vers le modèle DALL-E 3. Ce n'est pas le seul avantage offert par DALL-E 3 ; il génère également des images de haute qualité qui représentent mieux les invites. Ceci est particulièrement visible lorsqu’il s’agit d’invites plus longues et de la gestion de contenus qui ont auparavant ébranlé les modèles de génération d’images tels que le contenu textuel et les mains humaines.
La version mise à niveau introduit également de nouveaux mécanismes pour réduire les biais algorithmiques et améliorer la sécurité, selon OpenAI. Par exemple, il rejettera les demandes demandant des images dans le style d’artistes actuels ou des représentations de personnalités célèbres. De plus, les artistes ont désormais le choix de ne pas utiliser la totalité ou des parties spécifiques de leurs œuvres dans la formation des futures interprétations des modèles texte-image d'OpenAI. Cette décision est particulièrement remarquable à la lumière des poursuites en cours auxquelles OpenAI et certains de ses concurrents sont confrontés pour utilisation présumée d'œuvres d'art protégées par le droit d'auteur d'artistes pour entraîner leurs modèles d'images d'IA.
Le dévoilement de DALL-E 3 est en phase avec l’intensification de la concurrence dans le domaine génératif de l’IA, en particulier dans le domaine de la synthèse d’images. Des rivaux comme Midjourney et Stability AI affinent constamment leurs modèles de génération d'images, gardant OpenAI sur ses gardes.
DALL-E 3 devrait être déployé auprès des utilisateurs premium de ChatGPT en octobre, suivi des laboratoires de recherche et des clients API. OpenAI est resté silencieux sur ses projets de lancement d'un outil Web gratuit similaire à ses précédents modèles DALL-E.
De telles avancées dans la génération d’images IA pourraient profiter aux plateformes no-code comme AppMaster. Grâce à son outil robuste no-code, les utilisateurs AppMaster pourraient potentiellement intégrer ces capacités d'IA de niveau supérieur, facilitant ainsi le processus de création d'applications et de développement back-end. S'il est intégré correctement, cela pourrait ouvrir de nouvelles possibilités pour la conception d'applications visuelles, toutes disponibles via des solutions no-code.


