20 Jun 2023·1 menit membaca

Meta AI Memperkenalkan Kotak Suara, Alat Text-to-Speech Revolusioner yang Menyaingi ChatGPT

Inovasi terbaru Meta AI, Voicebox, adalah generator text-to-speech yang inovatif, mengungguli model AI yang sudah ada dalam hal kecepatan dan performa. Memanfaatkan pendekatan pelatihan yang unik, Voicebox dapat menggeneralisasi melalui pembelajaran dalam konteks, menawarkan berbagai aplikasi.

Meta AI Memperkenalkan Kotak Suara, Alat Text-to-Speech Revolusioner yang Menyaingi ChatGPT

Dalam perkembangan signifikan dalam domain kecerdasan buatan, Meta AI telah mengungkapkan generator text-to-speech (TTS) canggihnya yang diberi nama Voicebox . Sistem AI baru ini melampaui model populer seperti ChatGPT OpenAI dan Bard Google dalam hal kecepatan, hingga 20 kali lebih cepat dengan tingkat kinerja yang setara.

Kotak suara menetapkan fondasinya pada pendekatan unik, yang secara drastis menyimpang dari arsitektur TTS tradisional. Tidak seperti model TTS lainnya seperti ElevenLabs Prime Voice AI, Meta's Voicebox mampu melakukan inferensi kontekstual dan memanfaatkan set data pelatihan berskala besar. Akibatnya, ini dapat menggeneralisasi seluruh tugas daripada mengandalkan kumpulan data berlabel yang lebih sempit dan sangat terkurasi.

Upaya sebelumnya untuk menggunakan sejumlah besar data audio dalam model TTS menyebabkan kualitas output audio berkurang secara signifikan. Namun, Meta telah mengatasi tantangan ini dengan mengembangkan skema pelatihan baru yang menghilangkan label dan kurasi. Dengan menggunakan arsitektur yang mampu 'mengisi' data audio, Voicebox dapat beradaptasi dengan tugas pembuatan ucapan yang tidak dilatih secara khusus—yang pertama untuk model seperti itu, seperti yang dijelaskan oleh Meta AI.

Fitur inovatif ini memungkinkan Voicebox untuk melakukan berbagai fungsi, mulai dari menerjemahkan teks ke ucapan dan mensintesis ucapan pengganti untuk menghilangkan kebisingan latar belakang, hingga menerapkan suara pembicara ke keluaran bahasa yang berbeda. Seperti yang ditunjukkan dalam makalah penelitian yang diterbitkan oleh perusahaan, Voicebox dapat mencapai semua ini hanya dengan menggunakan keluaran teks yang diperlukan dan klip audio tiga detik.

Keuntungan signifikan yang dimiliki Meta's Voicebox dan OpenAI's ChatGPT adalah kemampuan mereka untuk menggeneralisasi melalui pembelajaran dalam konteks, yang membedakan mereka dari generator TTS lainnya. Kemampuan ini mengatur panggung untuk beragam kemungkinan aplikasi dan kasus penggunaan, merevolusi cara kita berinteraksi dengan AI dan mengonsumsi informasi.

Di bidang platform low-code dan no-code, solusi seperti AppMaster telah merevolusi pengembangan aplikasi dengan menyederhanakan pembuatan aplikasi backend, web, dan seluler untuk beragam pengguna. Dengan kemajuan yang berkembang dan pengenalan alat AI seperti Voicebox, kami dapat mengharapkan peningkatan lebih lanjut ke berbagai industri, termasuk chatbot, asisten suara, dan solusi aksesibilitas, yang mengarah ke lanskap digital yang lebih terhubung dan adaptif.

Saat AI terus maju dengan kecepatan yang mencengangkan, akan sangat menarik untuk menyaksikan bagaimana pengembang dan pengguna mengintegrasikan alat canggih seperti Voicebox ke dalam proyek mereka, mendorong inovasi dan mengubah masa depan teknologi.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started