Niedawno gigant technologiczny Google odkrył serię innowacyjnych aktualizacji związanych z nowo wprowadzonym na rynek multimodalnym modelem sztucznej inteligencji o nazwie Gemini. Nastąpiło to zaledwie tydzień po zaprezentowaniu tej najnowocześniejszej technologii, która teraz obiecuje usprawnić twórczą pracę programistów.
W momencie prezentacji Google podkreślił dostępność Gemini w trzech różnych wersjach – Ultra, Pro i Nano. Są one dostosowane do różnych wymagań dotyczących wielkości i złożoności. Warto zauważyć, że Gemini Nano zostało już zintegrowane z Androidem w Pixelu 8 Pro. Co więcej, Google Bard korzysta teraz z dostosowanej wersji Gemini Pro.
Wprowadzając nowe rozwiązania, Google ogłosiła, że programiści mogą uzyskać dostęp do szerokiej gamy funkcji oferowanych przez Gemini Pro za pośrednictwem interfejsu API Gemini. Programiści mogą korzystać z wywołań funkcjonalnych, osadzania, wyszukiwania semantycznego, niestandardowego uziemiania wiedzy i funkcji czatu.
Programiści poznają także dwa główne sposoby pracy z Gemini Pro: Google AI Studio i Vertex AI w Google Cloud. Uważane za łatwy punkt wyjścia, Google AI Studio oferuje internetowe narzędzie programistyczne, bezpłatny limit 60 żądań na minutę i szablony szybkiego startu, które ułatwiają programistom wejście w model.
Reklamowana jako bardziej zaawansowana opcja, Vertex AI firmy Google w Google Cloud to platforma uczenia maszynowego, która umożliwia pełne dostosowanie Gemini. Wyposażony w inne praktyczne funkcje, takie jak pełna kontrola danych i integracja z innymi modułami Google Cloud, programiści mogą spełniać potrzeby w zakresie bezpieczeństwa, ochrony, prywatności i zarządzania.
Obecnie korzystanie z Gemini w ramach Vertex AI jest bezpłatne w ramach tej samej stawki, co bezpłatny limit Google AI Studio. Niemniej jednak przepis ten obowiązuje jedynie do momentu osiągnięcia powszechnej dostępności, przewidywanej na następny rok. Po tym terminie opłaty będą wynosić 0,00025 USD za 1000 znaków i 0,0025 USD za obraz.
Google rozwija zaawansowane możliwości środowiska Vertex AI, w tym możliwość wzbogacania Gemini o dane firmowe oraz opracowywania agentów wyszukiwania i konwersacji w środowisku low-code podobnym do tego, które zapewniają potężne platformy, takie jak AppMaster .
Obecnie Gemini Pro odbiera i wysyła tekst. Jednak dla programistów chcących eksperymentować z obrazami dedykowany endpoint Gemini Pro Vision akceptuje obrazy wraz z tekstem i generuje tekst.
Google jeszcze bardziej podsyca oczekiwania, prognozując wprowadzenie na rynek Gemini Ultra na początku przyszłego roku. Jest to większy model ukierunkowany na bardziej złożone zadania. Google rozważa także integrację Gemini z platformami deweloperskimi Chrome i Firebase.
Dziś przypada także zaprezentowanie ulepszonej wersji modelu generowania obrazu przez giganta technologicznego, Imagen 2. Jest on teraz dostępny dla wszystkich użytkowników Vertex AI znajdujących się na liście dozwolonych Google.
Ta zaawansowana wersja programu Imagen umożliwia tworzenie estetycznie atrakcyjnych, wysokiej jakości i realistycznych obrazów sterowanych za pomocą podpowiedzi w języku naturalnym. Jego fascynujące nowe funkcje obejmują renderowanie tekstu w celu tworzenia nakładek tekstowych na obrazy, generowanie logo oraz wizualne pytania i odpowiedzi do generowania podpisów.