Num avanço significativo, a OpenAI tornou pública a disponibilidade geral da sua inovadora criação geradora de texto, GPT-4, através da sua API. A última evolução da popular série GPT traz uma experiência de utilizador melhorada, com privilégios agora alargados a um maior número de programadores.

O acesso ao GPT-4 começou para os desenvolvedores de API existentes com um histórico de pagamentos bem-sucedidos. Lançado em ondas, o acesso será progressivamente estendido a novos desenvolvedores até o final do mês e, eventualmente, os limites de disponibilidade aumentados - sujeito ao quantum de disponibilidade computacional.

Num post de blogue, a organização destacou o interesse crescente na API GPT-4 entre milhões de programadores desde o seu lançamento em março.

A OpenAI prevê uma gama crescente de produtos inovadores que aproveitam os pontos fortes da GPT-4. Para sublinhar a visão da empresa, declarou: Prevemos um futuro em que os modelos baseados em conversação possam suportar qualquer caso de utilização.

À semelhança das versões anteriores do GPT lançadas pela OpenAI, a formação do GPT-4 também englobou dados acessíveis ao público, incluindo dados de páginas Web públicas, complementados com dados licenciados.

Curiosamente, no entanto, a capacidade de compreensão de imagens ainda não está universalmente disponível para todos os clientes da OpenAI. Atualmente, está a ser testada por um único parceiro, a Be My Eyes, sem que esteja confirmado quando estará disponível para o resto da base de clientes da OpenAI.

No entanto, o GPT-4 tem limitações. O modelo tem tendência para "alucinar" com factos e, ocasionalmente, tem problemas de raciocínio lógico. Além disso, podem surgir problemas quando introduz vulnerabilidades de segurança no código que gera, uma vez que não aprende com a sua experiência.

Para resolver este problema, a empresa declarou que planeia desenvolver a capacidade de os programadores afinarem o GPT-4 e o GPT-3.5 Turbo, o seu outro modelo, com os seus próprios dados, em linha com as opções disponíveis em vários outros modelos de geração de texto da OpenAI. Esta funcionalidade deverá estar pronta a ser utilizada no final do ano.

Desde a revelação do GPT-4, o cenário competitivo da arena da IA generativa intensificou-se. Recentemente, a Anthropic lançou uma janela de contexto alargada para a sua IA geradora de texto, Claude. Normalmente numa fase de pré-visualização, a expansão para 100.000 tokens surgiu como um salto proeminente em relação aos 9.000 tokens anteriores.

Em termos leigos, a janela de contexto de um modelo representa o texto que analisa antes de gerar texto adicional. Por outro lado, os tokens denotam o texto em bruto. Quanto maior for a janela de contexto, mais contexto o modelo pode assimilar.

Ao mesmo tempo, a OpenAI revelou a disponibilidade geral das suas APIs DALL-E 2 e Whisper. DALL-E 2 significa o modelo de geração de imagens da OpenAI, enquanto Whisper se refere ao modelo de fala para texto da empresa. Curiosamente, a empresa também indicou um desmantelamento planeado de modelos mais antigos através da sua API para otimizar a sua capacidade computacional.

A partir de 4 de janeiro de 2024, os modelos OpenAI específicos mais antigos, nomeadamente o GPT-3 e as suas variantes, serão eliminados gradualmente, com substituições derivadas dos novos modelos GPT-3 de base. Para continuar a utilizar os modelos antigos depois de 4 de janeiro, os programadores terão de atualizar manualmente as suas integrações e afinar as substituições para os novos modelos.

Como prova do compromisso da OpenAI em oferecer uma óptima experiência ao utilizador, a empresa prometeu um suporte abrangente para os utilizadores que transitam dos modelos antigos ajustados para os novos. Os próximos planos incluem contactar os programadores que utilizam modelos mais antigos e oferecer informações essenciais quando os novos modelos estiverem prontos para serem testados.

