Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

OpenAI aumenta a funcionalidade do ChatGPT com capacidade de conversação verbal e reconhecimento de imagem

OpenAI aumenta a funcionalidade do ChatGPT com capacidade de conversação verbal e reconhecimento de imagem

OpenAI, um player proeminente em inteligência artificial, está expandindo as capacidades de seu estimado assistente, ChatGPT. Originalmente projetado como uma ferramenta de pesquisa baseada em texto, ChatGPT agora exibirá habilidades de processamento de voz e imagem, criando uma experiência mais interativa para seus usuários.

Desde a sua introdução, há aproximadamente nove meses, ChatGPT se tornou um grande fenômeno no espectro tecnológico. É profundamente apreciado por sua capacidade de compor ensaios, criar poemas e resumir textos extensos a partir de simples dicas de texto. No entanto, o assistente de IA agora está pronto para se tornar ainda mais envolvente. Agora ele dará ouvidos aos usuários, permitindo interações vocais.

Os usuários terão a oportunidade de dialogar por voz com ChatGPT. Por exemplo, o assistente pode ser solicitado a narrar uma história improvisada para dormir, guiada por dicas verbais do usuário. Perguntas simples também podem ser direcionadas ao auxílio, e as respostas serão entregues em linguagem falada.

Além disso, recursos de pesquisa baseados em imagens foram disponibilizados. Os usuários podem fazer upload de uma imagem e pedir ChatGPT para identificar ou explicar o item carregado ou solicitar instruções para atingir um objetivo específico.

Os recursos de interação por voz do ChatGPT foram aprimorados por um modelo superior de conversão de texto em fala que pode produzir vozes semelhantes às humanas a partir de texto e uma pequena amostra de fala. OpenAI revelou que colaborou com dubladores qualificados para gerar cinco vozes exclusivas. O sistema de reconhecimento de voz Whisper de código aberto da organização serve como tecnologia subjacente para a conversão de fala em texto.

Em um desenvolvimento emocionante, o Spotify entrou em cena como parceiro de lançamento. Ele introduziu um recurso valioso para podcasters, permitindo-lhes transcrever seus programas do inglês para o espanhol, francês ou alemão, mantendo o tom de voz original. No entanto, OpenAI revela que o acesso a esta tecnologia não é universal. Está disponível apenas para podcasters selecionados, incluindo Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett para o lançamento inicial.

Numa publicação no blog, OpenAI reconheceu os riscos potenciais associados à sua nova tecnologia de voz, no que diz respeito à probabilidade de fraude ou deturpação por parte de elementos não autorizados. Assim, faz questão de não gerar polêmica sobre seu lançamento.

A revelação destas novidades está prevista para a próxima quinzena. Eles estarão acessíveis inicialmente aos assinantes Plus e Enterprise. Para aproveitar os recursos de voz, os usuários devem navegar até as ‘configurações’ do aplicativo, selecionar ‘novos recursos’, ativar conversas de voz, tocar no botão do fone de ouvido localizado no canto superior direito e, por fim, escolher o voz preferida.

Para começar, apenas os usuários do aplicativo ChatGPT para Android e iOS poderão experimentar conversas de voz em uma versão beta opcional. O recurso de pesquisa baseada em imagens, entretanto, estará disponível em todas as plataformas por padrão.

Muitas plataformas no-code, como AppMaster, estão aguardando ansiosamente para ver a ampla gama de aplicativos que esse ChatGPT aprimorado renderia em um futuro próximo. Construir software empresarial sem código muitas vezes requer assistência sofisticada de IA para interatividade superior e aprimoramento da experiência do usuário.

Posts relacionados

AppMaster na BubbleCon 2024: Explorando tendências sem código
AppMaster na BubbleCon 2024: Explorando tendências sem código
A AppMaster participou da BubbleCon 2024 em Nova York, obtendo insights, expandindo redes e explorando oportunidades para impulsionar a inovação no espaço de desenvolvimento sem código.
Resumo do FFDC 2024: Principais insights da conferência de desenvolvedores do FlutterFlow em Nova York
Resumo do FFDC 2024: Principais insights da conferência de desenvolvedores do FlutterFlow em Nova York
O FFDC 2024 iluminou a cidade de Nova York, trazendo aos desenvolvedores insights de ponta sobre desenvolvimento de aplicativos com o FlutterFlow. Com sessões lideradas por especialistas, atualizações exclusivas e networking incomparável, foi um evento imperdível!
Demissões na área de tecnologia em 2024: a onda contínua que afeta a inovação
Demissões na área de tecnologia em 2024: a onda contínua que afeta a inovação
Com 60.000 empregos cortados em 254 empresas, incluindo gigantes como Tesla e Amazon, 2024 verá uma onda contínua de demissões no setor de tecnologia remodelando o cenário da inovação.
Comece gratuitamente
Inspirado para tentar isso sozinho?

A melhor maneira de entender o poder do AppMaster é ver por si mesmo. Faça seu próprio aplicativo em minutos com assinatura gratuita

Dê vida às suas ideias