OpenAI, een leider op het gebied van geavanceerde kunstmatige intelligentie, kondigt de introductie aan van zijn geüpgradede versie DALL-E 3. Deze geavanceerde weergave van de tekst-naar-afbeelding-tool van het bedrijf integreert ChatGPT, de gangbare AI-chatbot van OpenAI, om het proces van het vragen om afbeeldingen te stroomlijnen en aan te passen.
De belangrijkste op AI gebaseerde tools voor het genereren van afbeeldingen die momenteel operationeel zijn, zetten aanwijzingen of beeldbeschrijvingen om in een reeks kunstwerken met meerdere stijlen, van fotorealistisch tot fantasie. De uitdaging ligt echter in de ontwikkeling van een passende prompt, die de opkomst van 'prompt engineering' als een lovenswaardig beroep heeft gestimuleerd.
DALL-E 3 brengt een revolutie teweeg in dit proces door ChatGPT te implementeren om aanwijzingen te helpen verbeteren. Abonnees van ChatGPT Plus en ChatGPT Enterprise kunnen deze tool gebruiken door hun afbeeldingsverzoeken in te dienen en deze te verfijnen via discussies met de chatbot. Daarbij ontvangen ze de verfijnde resultaten rechtstreeks in de chatapplicatie.
ChatGPT heeft de mogelijkheid om aanwijzingen van slechts een paar woorden uit te breiden, waardoor ze beschrijvender worden en betere aanwijzingen voor het DALL-E 3-model worden geboden. Dit is niet het enige voordeel van DALL-E 3; het genereert ook afbeeldingen van hoge kwaliteit die aanwijzingen beter weergeven. Dit wordt vooral opgemerkt bij het omgaan met langere prompts en het omgaan met inhoud die voorheen beeldgenererende modellen zoals tekstuele inhoud en mensenhanden in de war bracht.
De geüpgradede versie introduceert ook nieuwe mechanismen om algoritmische vooroordelen te verminderen en de veiligheid te vergroten, aldus OpenAI. Het zal bijvoorbeeld verzoeken afwijzen waarin wordt gevraagd om afbeeldingen in de stijl van huidige kunstenaars of representaties van beroemde personen. Bovendien hebben kunstenaars nu de keuze om niet langer alle of specifieke delen van hun kunstwerken te gebruiken bij het trainen van toekomstige uitvoeringen van de tekst-naar-beeldmodellen van OpenAI. Deze beslissing is vooral opmerkelijk in het licht van de lopende rechtszaken waarmee OpenAI en enkele van zijn concurrenten worden geconfronteerd wegens vermeend gebruik van auteursrechtelijk beschermde kunstwerken van kunstenaars om hun AI-beeldmodellen te trainen.
De onthulling van DALL-E 3 loopt synchroon met de toenemende concurrentie op het gebied van AI-generatie, vooral op het gebied van beeldsynthese. Rivalen als Midjourney en Stability AI verfijnen voortdurend hun beeldgenererende modellen, waardoor OpenAI scherp blijft.
DALL-E 3 zal in oktober worden uitgerold naar premium ChatGPT-gebruikers, gevolgd door onderzoekslaboratoria en API-klanten. OpenAI zwijgt over zijn plannen voor het lanceren van een gratis webtool vergelijkbaar met zijn eerdere DALL-E-modellen.
Dergelijke verbeteringen op het gebied van het genereren van AI-afbeeldingen zouden ten goede kunnen komen aan no-code platforms zoals AppMaster. Met zijn robuuste no-code tool zouden AppMaster gebruikers deze AI-mogelijkheden van het volgende niveau potentieel kunnen integreren, waardoor het proces van het maken van apps en de ontwikkeling van de backend wordt vergemakkelijkt. Indien correct geïntegreerd, zou dit nieuwe mogelijkheden kunnen openen voor visueel app-ontwerp, allemaal beschikbaar via no-code oplossingen.