Modelo de IA multimodal evoluído do Google, Gemini Pro, desdobrado para fins de desenvolvimento

Recentemente, o gigante da tecnologia Google desvendou uma série de atualizações inovadoras relacionadas ao seu recém-lançado modelo de IA multimodal, Gemini. Isto aconteceu apenas uma semana depois de revelar esta tecnologia de ponta que agora promete reforçar o trabalho criativo dos desenvolvedores.

No momento do seu lançamento, o Google destacou a disponibilidade do Gemini em três versões distintas – Ultra, Pro e Nano. Eles são adaptados de acordo com diferentes requisitos de tamanho e complexidade. Digno de nota, o Gemini Nano já foi incorporado ao Android com o Pixel 8 Pro. Além disso, o Google Bard agora se beneficia de uma versão adaptada do Gemini Pro.

Abrindo novos caminhos, Google anunciou agora que os desenvolvedores podem acessar a ampla gama de recursos que o Gemini Pro oferece por meio da API Gemini. Os desenvolvedores podem usar chamadas funcionais, incorporações, recuperação semântica, base de conhecimento personalizada e funcionalidade de chat.

Os desenvolvedores também conhecem duas maneiras principais de trabalhar com o Gemini Pro: Google AI Studio e Vertex AI no Google Cloud. Considerado um ponto de partida fácil, o Google AI Studio oferece uma ferramenta de desenvolvimento baseada na web, uma cota gratuita para 60 solicitações por minuto e modelos de início rápido para facilitar a integração dos desenvolvedores no modelo.

Apresentado como uma opção mais sofisticada, o Vertex AI do Google no Google Cloud é uma plataforma de aprendizado de máquina que permite a personalização total do Gemini. Carregado com outros recursos práticos, como controle total de dados e integração com outros módulos do Google Cloud, os desenvolvedores podem atender às necessidades de segurança, proteção, privacidade e governança.

Atualmente, o uso do Gemini no Vertex AI é gratuito na mesma taxa da cota gratuita do Google AI Studio. No entanto, esta disposição estende-se apenas até atingir a disponibilidade geral, prevista para o ano seguinte. Depois disso, as cobranças serão de US$ 0,00025 por 1.000 caracteres e US$ 0,0025 por imagem.

O Google discorre sobre os recursos sofisticados do ambiente Vertex AI, incluindo a capacidade de aprimorar o Gemini com dados da empresa e desenvolver agentes de pesquisa e conversação em um ambiente low-code semelhante ao que plataformas poderosas como o AppMaster oferecem.

Atualmente, o Gemini Pro recebe e envia texto. Mas para desenvolvedores ansiosos por experimentar imagens, um endpoint Gemini Pro Vision dedicado aceita imagens junto com texto e gera texto.

O Google aumenta ainda mais a expectativa com a previsão de lançar o Gemini Ultra no início do próximo ano. Este é um modelo maior voltado para tarefas mais complexas. O Google também está considerando integrar o Gemini às plataformas de desenvolvedores Chrome e Firebase.

Hoje também marca o lançamento da versão atualizada do modelo de geração de imagens do gigante da tecnologia, Imagen 2. Agora está aberto para todos os usuários do Vertex AI incluídos na lista de permissões do Google.

Esta iteração avançada do Imagen permite a produção de imagens esteticamente envolventes, de alta qualidade e realistas, orientadas por instruções de linguagem natural. Seus novos recursos fascinantes consistem em renderização de texto para criar sobreposições de texto em imagens, geração de logotipo e perguntas e respostas visuais para geração de legendas.

Modelo de IA multimodal evoluído do Google, Gemini Pro, desdobrado para fins de desenvolvimento

Posts relacionados