OpenAI, lider zaawansowanej sztucznej inteligencji, ogłasza wprowadzenie na rynek swojej ulepszonej wersji DALL-E 3. Ta zaawansowana wersja firmowego narzędzia do przetwarzania tekstu na obraz integruje ChatGPT, popularnego chatbota AI w OpenAI, aby usprawnić i zmodyfikować proces wyświetlania monitów o obrazy.
Główne obecnie działające narzędzia do generowania obrazów oparte na sztucznej inteligencji przekształcają podpowiedzi lub opisy obrazów w szereg dzieł sztuki w wielu stylach, od fotorealistycznych po fantasy. Wyzwanie polega jednak na opracowaniu odpowiedniego narzędzia, co przyczyniło się do wyłonienia się „szybkiej inżynierii” jako zawodu godnego pochwały.
DALL-E 3 rewolucjonizuje ten proces poprzez wdrożenie ChatGPT, aby pomóc w ulepszeniu podpowiedzi. Abonenci ChatGPT Plus i ChatGPT Enterprise mogą wykorzystać to narzędzie, przesyłając prośby o zdjęcia i dostosowując je w drodze dyskusji z chatbotem. W ten sposób otrzymują dopracowane wyniki bezpośrednio w aplikacji do czatowania.
ChatGPT ma możliwość rozwijania podpowiedzi o długości zaledwie kilku słów, czyniąc je bardziej opisowymi i zapewniając ulepszone wskazówki dla modelu DALL-E 3. To nie jedyna zaleta DALL-E 3; generuje również wysokiej jakości obrazy, które lepiej reprezentują podpowiedzi. Jest to szczególnie zauważalne w przypadku dłuższych podpowiedzi i obsługi treści, które wcześniej wstrząsały modelami generującymi obrazy, takimi jak treść tekstowa i ludzkie ręce.
Według OpenAI ulepszona wersja wprowadza także nowe mechanizmy zmniejszające błąd algorytmiczny i zwiększające bezpieczeństwo. Odrzuci na przykład prośby o obrazy w stylu obecnych artystów lub podobizny znanych osób. Co więcej, artyści mają teraz możliwość rezygnacji z wykorzystywania całości lub określonych części ich dzieł sztuki w przyszłych wersjach modeli zamiany tekstu na obraz OpenAI. Decyzja ta jest szczególnie godna uwagi w świetle toczących się procesów sądowych, przed którymi stoi OpenAI i niektórzy z jej konkurentów w związku z rzekomym wykorzystaniem dzieł artystów chronionych prawem autorskim do szkolenia ich modeli obrazów AI.
Odsłonięcie DALL-E 3 wpisuje się w rosnącą konkurencję w dziedzinie generowania sztucznej inteligencji, szczególnie w sferze syntezy obrazu. Rywale tacy jak Midjourney i Stability AI nieustannie udoskonalają swoje modele generowania obrazu, utrzymując OpenAI w czołówce.
DALL-E 3 zostanie udostępniony użytkownikom premium ChatGPT w październiku, a następnie laboratoriom badawczym i klientom API. OpenAI milczy na temat swoich planów uruchomienia bezpłatnego narzędzia internetowego podobnego do swoich poprzednich modeli DALL-E.
Takie postępy w generowaniu obrazów AI mogą przynieść korzyści platformom no-code takim jak AppMaster. Dzięki niezawodnemu narzędziu no-code użytkownicy AppMaster mogą potencjalnie zintegrować funkcje sztucznej inteligencji następnego poziomu, ułatwiając proces tworzenia aplikacji i rozwoju zaplecza. Prawidłowo zintegrowane może otworzyć nowe możliwości wizualnego projektowania aplikacji, dostępne za pośrednictwem rozwiązań no-code.