OpenAI, leader nell'intelligenza artificiale avanzata, annuncia l'introduzione della sua versione aggiornata DALL-E 3. Questa versione avanzata dello strumento di conversione testo in immagine dell'azienda integra ChatGPT, il chatbot AI prevalente di OpenAI, per semplificare e modificare il processo di richiesta delle immagini.
I principali strumenti di generazione di immagini basati sull’intelligenza artificiale attualmente operativi trasformano i suggerimenti o le descrizioni delle immagini in una serie di opere d’arte con stili multipli, dal fotorealistico al fantasy. Tuttavia, la sfida sta nello sviluppo di un prompt adeguato, che ha stimolato l'emergere del "prompt engineering" come professione encomiabile.
DALL-E 3 rivoluziona questo processo implementando ChatGPT per aiutare a migliorare i prompt. Gli abbonati a ChatGPT Plus e ChatGPT Enterprise possono sfruttare questo strumento inviando le proprie richieste di immagini e perfezionandole attraverso discussioni con il chatbot. In tal modo ricevono i risultati perfezionati direttamente all'interno dell'applicazione di chat.
ChatGPT ha la capacità di espandere istruzioni brevi di poche parole, rendendole più descrittive e fornendo indicazioni migliorate al modello DALL-E 3. Questo non è l'unico vantaggio fornito con DALL-E 3; genera inoltre immagini di alta qualità che rappresentano meglio i suggerimenti. Ciò è particolarmente evidente quando si hanno a che fare con istruzioni più lunghe e si gestiscono contenuti che in precedenza hanno scosso modelli di generazione di immagini come contenuti testuali e mani umane.
Secondo OpenAI, la versione aggiornata introduce anche nuovi meccanismi per ridurre i bias algoritmici e migliorare la sicurezza. Ad esempio, rifiuterà le richieste che richiedono immagini nello stile di artisti attuali o rappresentazioni di personaggi famosi. Inoltre, gli artisti ora possono scegliere di rinunciare all'utilizzo di tutte o parti specifiche della loro opera d'arte nell'addestramento delle future interpretazioni dei modelli testo-immagine di OpenAI. Questa decisione è particolarmente degna di nota alla luce delle cause legali pendenti che OpenAI e alcuni dei suoi concorrenti stanno affrontando per il presunto utilizzo di opere d'arte protette da copyright da parte di artisti per addestrare i loro modelli di immagini AI.
La presentazione di DALL-E 3 è in sincronia con la crescente concorrenza nel campo generativo dell’intelligenza artificiale, in particolare nella sfera della sintesi delle immagini. Rivali come Midjourney e Stability AI stanno costantemente perfezionando i loro modelli di generazione di immagini, mantenendo OpenAI all'erta.
DALL-E 3 sarà distribuito agli utenti premium di ChatGPT a ottobre, seguito dai laboratori di ricerca e dai clienti API. OpenAI è rimasta in silenzio riguardo ai suoi piani per il lancio di uno strumento web gratuito simile ai suoi precedenti modelli DALL-E.
Tali progressi nella generazione di immagini AI potrebbero avvantaggiare piattaforme no-code come AppMaster. Con il suo robusto strumento no-code, gli utenti AppMaster potrebbero potenzialmente integrare queste funzionalità di intelligenza artificiale di livello successivo, facilitando il processo di creazione di app e sviluppo backend. Se integrato correttamente, questo potrebbe aprire nuove possibilità per la progettazione di app visive, tutte disponibili tramite soluzioni no-code.