Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

OpenAI potenzia le funzionalità di ChatGPT con funzionalità di conversazione verbale e riconoscimento delle immagini

OpenAI potenzia le funzionalità di ChatGPT con funzionalità di conversazione verbale e riconoscimento delle immagini

OpenAI, un attore di spicco nel campo dell'intelligenza artificiale, sta espandendo le capacità del suo stimato assistente, ChatGPT. Originariamente progettato come strumento di ricerca basato su testo, ChatGPT ora sfoggerà capacità di elaborazione vocale e di immagini, creando un'esperienza più interattiva per i suoi utenti.

Dalla sua introduzione circa nove mesi fa, ChatGPT è diventato un grande fenomeno nello spettro tecnologico. È profondamente apprezzato per la sua capacità di comporre saggi, creare poesie e riassumere testi estesi a partire da semplici spunti testuali. Tuttavia, l’assistente AI è ora destinato a diventare ancora più coinvolgente. Ora presterà le sue orecchie agli utenti, consentendo interazioni vocali.

Gli utenti avranno l'opportunità di impegnarsi in un dialogo vocale con ChatGPT. Ad esempio, all'assistente potrebbe essere chiesto di narrare una favola improvvisata della buonanotte guidata da segnali verbali dell'utente. È inoltre possibile rivolgere agli aiuti semplici domande e le risposte verranno fornite in lingua parlata.

Inoltre, sono state rese disponibili funzionalità di ricerca basate su immagini. Gli utenti possono caricare un'immagine e chiedere ChatGPT di identificare o spiegare l'elemento caricato o richiedere indicazioni per raggiungere un obiettivo specifico.

Le capacità di interazione vocale di ChatGPT sono state ottimizzate da un modello di sintesi vocale superiore in grado di produrre voci simili a quelle umane dal testo e da un breve campione di parlato. OpenAI ha rivelato di aver collaborato con doppiatori esperti per generare cinque voci esclusive. Il sistema di riconoscimento vocale Whisper open source dell'organizzazione funge da tecnologia di base per convertire la voce in testo.

In uno sviluppo entusiasmante, Spotify è intervenuta come partner di lancio. Ha introdotto una funzionalità preziosa per i podcaster che consente loro di trascrivere i loro programmi dall'inglese allo spagnolo, al francese o al tedesco mantenendo il tono di voce originale. Tuttavia, OpenAI rivela che l’accesso a questa tecnologia non è universale. È disponibile solo per podcaster selezionati tra cui Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett per il lancio iniziale.

In un post sul blog, OpenAI ha riconosciuto i potenziali rischi associati alla sua nuova tecnologia vocale, riguardanti la probabilità di frode o falsa dichiarazione da parte di elementi non autorizzati. Pertanto, si sta assicurando di non suscitare alcuna controversia sulla sua uscita.

La presentazione di queste nuove funzionalità è prevista per le prossime due settimane. Inizialmente saranno accessibili agli abbonati Plus ed Enterprise. Per usufruire delle funzionalità vocali, gli utenti devono accedere alle "impostazioni" dell'app, selezionare "nuove funzionalità", attivare le conversazioni vocali, toccare il pulsante delle cuffie situato nell'angolo in alto a destra e, infine, scegliere l'opzione voce preferita.

Per cominciare, solo gli utenti dell'app ChatGPT per Android e iOS potranno sperimentare conversazioni vocali su base beta. La funzionalità di ricerca basata sulle immagini, tuttavia, sarà disponibile su tutte le piattaforme per impostazione predefinita.

Molte piattaforme no-code, come AppMaster, attendono con impazienza di vedere l’ampia gamma di applicazioni che questo ChatGPT potenziato potrebbe produrre nel prossimo futuro. La creazione di software aziendale senza codice spesso richiede un'assistenza AI così sofisticata per un'interattività superiore e un miglioramento dell'esperienza utente.

Post correlati

AppMaster a BubbleCon 2024: esplorazione delle tendenze senza codice
AppMaster a BubbleCon 2024: esplorazione delle tendenze senza codice
AppMaster ha partecipato al BubbleCon 2024 di New York, acquisendo informazioni, ampliando le reti ed esplorando opportunità per guidare l'innovazione nello spazio di sviluppo no-code.
Riepilogo FFDC 2024: approfondimenti chiave dalla FlutterFlow Developers Conference di New York
Riepilogo FFDC 2024: approfondimenti chiave dalla FlutterFlow Developers Conference di New York
FFDC 2024 ha illuminato New York City, offrendo agli sviluppatori approfondimenti all'avanguardia sullo sviluppo di app con FlutterFlow. Con sessioni condotte da esperti, aggiornamenti esclusivi e networking senza pari, è stato un evento da non perdere!
Licenziamenti tecnologici del 2024: l'ondata continua che colpisce l'innovazione
Licenziamenti tecnologici del 2024: l'ondata continua che colpisce l'innovazione
Con 60.000 posti di lavoro tagliati in 254 aziende, tra cui giganti come Tesla e Amazon, il 2024 vedrà una continua ondata di licenziamenti nel settore tecnologico che rimodellerà il panorama dell'innovazione.
Inizia gratis
Ispirato a provarlo tu stesso?

Il modo migliore per comprendere il potere di AppMaster è vederlo di persona. Crea la tua applicazione in pochi minuti con l'abbonamento gratuito

Dai vita alle tue idee