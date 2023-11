OpenAI, um player proeminente em inteligência artificial, está expandindo as capacidades de seu estimado assistente, ChatGPT. Originalmente projetado como uma ferramenta de pesquisa baseada em texto, ChatGPT agora exibirá habilidades de processamento de voz e imagem, criando uma experiência mais interativa para seus usuários.

Desde a sua introdução, há aproximadamente nove meses, ChatGPT se tornou um grande fenômeno no espectro tecnológico. É profundamente apreciado por sua capacidade de compor ensaios, criar poemas e resumir textos extensos a partir de simples dicas de texto. No entanto, o assistente de IA agora está pronto para se tornar ainda mais envolvente. Agora ele dará ouvidos aos usuários, permitindo interações vocais.

Os usuários terão a oportunidade de dialogar por voz com ChatGPT. Por exemplo, o assistente pode ser solicitado a narrar uma história improvisada para dormir, guiada por dicas verbais do usuário. Perguntas simples também podem ser direcionadas ao auxílio, e as respostas serão entregues em linguagem falada.

Além disso, recursos de pesquisa baseados em imagens foram disponibilizados. Os usuários podem fazer upload de uma imagem e pedir ChatGPT para identificar ou explicar o item carregado ou solicitar instruções para atingir um objetivo específico.

Os recursos de interação por voz do ChatGPT foram aprimorados por um modelo superior de conversão de texto em fala que pode produzir vozes semelhantes às humanas a partir de texto e uma pequena amostra de fala. OpenAI revelou que colaborou com dubladores qualificados para gerar cinco vozes exclusivas. O sistema de reconhecimento de voz Whisper de código aberto da organização serve como tecnologia subjacente para a conversão de fala em texto.

Em um desenvolvimento emocionante, o Spotify entrou em cena como parceiro de lançamento. Ele introduziu um recurso valioso para podcasters, permitindo-lhes transcrever seus programas do inglês para o espanhol, francês ou alemão, mantendo o tom de voz original. No entanto, OpenAI revela que o acesso a esta tecnologia não é universal. Está disponível apenas para podcasters selecionados, incluindo Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett para o lançamento inicial.

Numa publicação no blog, OpenAI reconheceu os riscos potenciais associados à sua nova tecnologia de voz, no que diz respeito à probabilidade de fraude ou deturpação por parte de elementos não autorizados. Assim, faz questão de não gerar polêmica sobre seu lançamento.

A revelação destas novidades está prevista para a próxima quinzena. Eles estarão acessíveis inicialmente aos assinantes Plus e Enterprise. Para aproveitar os recursos de voz, os usuários devem navegar até as ‘configurações’ do aplicativo, selecionar ‘novos recursos’, ativar conversas de voz, tocar no botão do fone de ouvido localizado no canto superior direito e, por fim, escolher o voz preferida.

Para começar, apenas os usuários do aplicativo ChatGPT para Android e iOS poderão experimentar conversas de voz em uma versão beta opcional. O recurso de pesquisa baseada em imagens, entretanto, estará disponível em todas as plataformas por padrão.

Muitas plataformas no-code, como AppMaster, estão aguardando ansiosamente para ver a ampla gama de aplicativos que esse ChatGPT aprimorado renderia em um futuro próximo. Construir software empresarial sem código muitas vezes requer assistência sofisticada de IA para interatividade superior e aprimoramento da experiência do usuário.