OpenAI, líder em inteligência artificial avançada, anuncia o lançamento de sua versão atualizada DALL-E 3. Esta versão avançada da ferramenta de texto para imagem da empresa integra ChatGPT, o chatbot de IA predominante da OpenAI, para agilizar e modificar o processo de solicitação de imagens.
As principais ferramentas de geração de imagens baseadas em IA em operação atualmente transformam prompts ou descrições de imagens em uma variedade de obras de arte com vários estilos, do fotorrealista à fantasia. No entanto, o desafio reside no desenvolvimento de um prompt adequado, o que estimulou o surgimento da “engenharia imediata” como uma profissão louvável.
O DALL-E 3 revoluciona esse processo ao implementar o ChatGPT para auxiliar na melhoria dos prompts. Os assinantes do ChatGPT Plus e ChatGPT Enterprise podem aproveitar esta ferramenta enviando suas solicitações de imagens e ajustando-as por meio de discussões com o chatbot. Ao fazer isso, eles recebem os resultados refinados diretamente no aplicativo de bate-papo.
ChatGPT tem a capacidade de expandir prompts tão curtos quanto algumas palavras, tornando-os mais descritivos e fornecendo instruções aprimoradas para o modelo DALL-E 3. Esta não é a única vantagem que vem com o DALL-E 3; também gera imagens de alta qualidade que representam melhor os prompts. Isso é particularmente notado ao lidar com prompts mais longos e ao lidar com conteúdos que anteriormente abalavam modelos de geração de imagens, como conteúdo textual e mãos humanas.
A versão atualizada também introduz novos mecanismos para diminuir o viés algorítmico e aumentar a segurança, de acordo com a OpenAI. Por exemplo, rejeitará pedidos de imagens no estilo de artistas atuais ou representações de personalidades famosas. Além disso, os artistas agora têm a opção de optar por não utilizar todas ou partes específicas de suas obras de arte no treinamento de versões futuras dos modelos de texto para imagem da OpenAI. Esta decisão é particularmente digna de nota à luz dos processos judiciais pendentes que a OpenAI e alguns dos seus concorrentes enfrentam por alegada utilização de obras de arte protegidas por direitos de autor de artistas para treinar os seus modelos de imagem de IA.
A inauguração do DALL-E 3 está em sincronia com a intensificação da competição no campo gerador de IA, particularmente na esfera da síntese de imagens. Rivais como Midjourney e Stability AI estão refinando persistentemente seus modelos de geração de imagens, mantendo a OpenAI alerta.
O DALL-E 3 será lançado para usuários premium do ChatGPT em outubro, seguido por laboratórios de pesquisa e clientes de API. A OpenAI permaneceu em silêncio sobre seus planos de lançar uma ferramenta web gratuita semelhante aos seus modelos DALL-E anteriores.
Esses avanços na geração de imagens de IA podem beneficiar plataformas no-code como AppMaster. Com sua ferramenta robusta no-code, os usuários AppMaster poderiam integrar esses recursos de IA de próximo nível, facilitando o processo de criação de aplicativos e desenvolvimento de back-end. Se integrado corretamente, isso poderá abrir novas possibilidades para o design visual de aplicativos, todas disponíveis por meio de soluções no-code.