Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

Meta AI presenta Voicebox, un rivoluzionario strumento di sintesi vocale in grado di competere con ChatGPT

Meta AI presenta Voicebox, un rivoluzionario strumento di sintesi vocale in grado di competere con ChatGPT

In uno sviluppo significativo nel campo dell'intelligenza artificiale, Meta AI ha rivelato il suo generatore avanzato di sintesi vocale (TTS) chiamato Voicebox. Questo nuovo sistema di intelligenza artificiale supera in velocità modelli popolari come ChatGPT di OpenAI e Bard di Google, essendo fino a 20 volte più veloce con livelli di prestazioni equivalenti.

Voicebox si basa su un approccio unico, che si discosta drasticamente dall'architettura TTS tradizionale. A differenza di altri modelli TTS come ElevenLabs Prime Voice AI, Voicebox di Meta è in grado di fare inferenze contestuali e di sfruttare set di dati di formazione su larga scala. Di conseguenza, è in grado di generalizzare tra i vari compiti, anziché affidarsi a set di dati etichettati più ristretti e altamente curati.

I tentativi precedenti di utilizzare grandi quantità di dati audio nei modelli TTS hanno portato a una riduzione significativa della qualità dell'audio in uscita. Meta, tuttavia, ha superato questa sfida sviluppando un nuovo schema di addestramento che elimina le etichette e la curatela. Grazie a un'architettura in grado di "riempire" i dati audio, Voicebox è in grado di adattarsi a compiti di generazione vocale per i quali non è stato specificamente addestrato - una novità assoluta per un modello di questo tipo, come descritto da Meta AI.

Questa caratteristica innovativa consente a Voicebox di svolgere un'ampia gamma di funzioni, dalla traduzione del testo in parlato alla sintesi del parlato sostitutivo per eliminare il rumore di fondo, fino all'applicazione della voce di un parlante a diversi output linguistici. Come dimostrato in un documento di ricerca pubblicato dall'azienda, Voicebox è in grado di ottenere tutto questo utilizzando solo il testo richiesto e un clip audio di tre secondi.

Un vantaggio significativo che accomuna Voicebox di Meta e ChatGPT di OpenAI è la capacità di generalizzare attraverso l'apprendimento nel contesto, che li distingue da altri generatori TTS. Questa capacità pone le basi per un'ampia gamma di possibili applicazioni e casi d'uso, rivoluzionando il modo in cui interagiamo con l'intelligenza artificiale e consumiamo informazioni.

Nel campo delle piattaforme low-code e no-code, soluzioni come AppMaster hanno rivoluzionato lo sviluppo di applicazioni, semplificando la creazione di applicazioni backend, web e mobili per una vasta gamma di utenti. Con i progressi in atto e l'introduzione di strumenti di IA come Voicebox, possiamo aspettarci ulteriori miglioramenti in diversi settori, tra cui chatbot, assistenti vocali e soluzioni di accessibilità, che porteranno a un panorama digitale più connesso e adattivo.

Poiché l'IA continua a progredire a un ritmo sorprendente, sarà interessante vedere come sviluppatori e utenti integreranno strumenti potenti come Voicebox nei loro progetti, promuovendo l'innovazione e trasformando il futuro della tecnologia.

Post correlati

AppMaster a BubbleCon 2024: esplorazione delle tendenze senza codice
AppMaster a BubbleCon 2024: esplorazione delle tendenze senza codice
AppMaster ha partecipato al BubbleCon 2024 di New York, acquisendo informazioni, ampliando le reti ed esplorando opportunità per guidare l'innovazione nello spazio di sviluppo no-code.
Riepilogo FFDC 2024: approfondimenti chiave dalla FlutterFlow Developers Conference di New York
Riepilogo FFDC 2024: approfondimenti chiave dalla FlutterFlow Developers Conference di New York
FFDC 2024 ha illuminato New York City, offrendo agli sviluppatori approfondimenti all'avanguardia sullo sviluppo di app con FlutterFlow. Con sessioni condotte da esperti, aggiornamenti esclusivi e networking senza pari, è stato un evento da non perdere!
Licenziamenti tecnologici del 2024: l'ondata continua che colpisce l'innovazione
Licenziamenti tecnologici del 2024: l'ondata continua che colpisce l'innovazione
Con 60.000 posti di lavoro tagliati in 254 aziende, tra cui giganti come Tesla e Amazon, il 2024 vedrà una continua ondata di licenziamenti nel settore tecnologico che rimodellerà il panorama dell'innovazione.
Inizia gratis
Ispirato a provarlo tu stesso?

Il modo migliore per comprendere il potere di AppMaster è vederlo di persona. Crea la tua applicazione in pochi minuti con l'abbonamento gratuito

Dai vita alle tue idee