In uno sviluppo significativo nel campo dell'intelligenza artificiale, Meta AI ha rivelato il suo generatore avanzato di sintesi vocale (TTS) chiamato Voicebox. Questo nuovo sistema di intelligenza artificiale supera in velocità modelli popolari come ChatGPT di OpenAI e Bard di Google, essendo fino a 20 volte più veloce con livelli di prestazioni equivalenti.
Voicebox si basa su un approccio unico, che si discosta drasticamente dall'architettura TTS tradizionale. A differenza di altri modelli TTS come ElevenLabs Prime Voice AI, Voicebox di Meta è in grado di fare inferenze contestuali e di sfruttare set di dati di formazione su larga scala. Di conseguenza, è in grado di generalizzare tra i vari compiti, anziché affidarsi a set di dati etichettati più ristretti e altamente curati.
I tentativi precedenti di utilizzare grandi quantità di dati audio nei modelli TTS hanno portato a una riduzione significativa della qualità dell'audio in uscita. Meta, tuttavia, ha superato questa sfida sviluppando un nuovo schema di addestramento che elimina le etichette e la curatela. Grazie a un'architettura in grado di "riempire" i dati audio, Voicebox è in grado di adattarsi a compiti di generazione vocale per i quali non è stato specificamente addestrato - una novità assoluta per un modello di questo tipo, come descritto da Meta AI.
Questa caratteristica innovativa consente a Voicebox di svolgere un'ampia gamma di funzioni, dalla traduzione del testo in parlato alla sintesi del parlato sostitutivo per eliminare il rumore di fondo, fino all'applicazione della voce di un parlante a diversi output linguistici. Come dimostrato in un documento di ricerca pubblicato dall'azienda, Voicebox è in grado di ottenere tutto questo utilizzando solo il testo richiesto e un clip audio di tre secondi.
Un vantaggio significativo che accomuna Voicebox di Meta e ChatGPT di OpenAI è la capacità di generalizzare attraverso l'apprendimento nel contesto, che li distingue da altri generatori TTS. Questa capacità pone le basi per un'ampia gamma di possibili applicazioni e casi d'uso, rivoluzionando il modo in cui interagiamo con l'intelligenza artificiale e consumiamo informazioni.
Nel campo delle piattaforme low-code e no-code, soluzioni come AppMaster hanno rivoluzionato lo sviluppo di applicazioni, semplificando la creazione di applicazioni backend, web e mobili per una vasta gamma di utenti. Con i progressi in atto e l'introduzione di strumenti di IA come Voicebox, possiamo aspettarci ulteriori miglioramenti in diversi settori, tra cui chatbot, assistenti vocali e soluzioni di accessibilità, che porteranno a un panorama digitale più connesso e adattivo.
Poiché l'IA continua a progredire a un ritmo sorprendente, sarà interessante vedere come sviluppatori e utenti integreranno strumenti potenti come Voicebox nei loro progetti, promuovendo l'innovazione e trasformando il futuro della tecnologia.