Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

OpenAI Meningkatkan Fungsi ChatGPT dengan Kemampuan Percakapan Verbal dan Pengenalan Gambar

OpenAI Meningkatkan Fungsi ChatGPT dengan Kemampuan Percakapan Verbal dan Pengenalan Gambar

OpenAI, pemain terkemuka dalam kecerdasan buatan, memperluas kemampuan asistennya yang terhormat, ChatGPT. Awalnya dirancang sebagai alat pencarian berbasis teks, ChatGPT kini memamerkan kemampuan pemrosesan suara dan gambar, menciptakan pengalaman yang lebih interaktif bagi penggunanya.

Sejak diperkenalkan sekitar sembilan bulan lalu, ChatGPT telah menjadi fenomena besar dalam spektrum teknologi. Ini sangat dihargai karena kemampuannya dalam menyusun esai, membuat puisi, dan merangkum teks ekstensif dari petunjuk teks sederhana. Namun, asisten AI kini siap menjadi lebih menarik. Sekarang akan mendengarkan pengguna, memungkinkan interaksi vokal.

Pengguna akan mendapat kesempatan untuk terlibat dalam dialog suara dengan ChatGPT. Misalnya, asisten dapat diminta untuk menceritakan kisah pengantar tidur dadakan yang dipandu oleh isyarat verbal dari pengguna. Pertanyaan sederhana juga dapat diarahkan ke bantuan, dan tanggapan akan disampaikan dalam bahasa lisan.

Selain itu, fitur pencarian berbasis gambar telah tersedia. Pengguna dapat mengunggah gambar dan meminta ChatGPT untuk mengidentifikasi atau menjelaskan item yang diunggah atau meminta petunjuk arah untuk mencapai tujuan tertentu.

Kemampuan interaksi suara ChatGPT telah disempurnakan dengan model text-to-speech unggul yang dapat menghasilkan suara mirip manusia dari teks dan sampel ucapan singkat. OpenAI mengungkapkan bahwa mereka telah berkolaborasi dengan pengisi suara terampil untuk menghasilkan lima suara eksklusif. Sistem pengenalan ucapan Whisper yang bersumber terbuka dari organisasi ini berfungsi sebagai teknologi dasar untuk mengubah ucapan menjadi teks.

Dalam perkembangan yang menggembirakan, Spotify telah berperan sebagai mitra peluncuran. Ini telah memperkenalkan fitur berharga bagi podcaster yang memungkinkan mereka mentranskripsikan acara mereka dari bahasa Inggris ke bahasa Spanyol, Prancis, atau Jerman sambil mempertahankan nada suara aslinya. Meski demikian, OpenAI mengungkapkan bahwa akses terhadap teknologi ini tidak bersifat universal. Ini hanya tersedia untuk podcaster tertentu termasuk Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons, dan Steven Bartlett untuk peluncuran awal.

Dalam postingan blognya, OpenAI mengakui potensi risiko yang terkait dengan teknologi suara barunya, terkait kemungkinan penipuan atau representasi keliru yang dilakukan oleh elemen jahat. Oleh karena itu, mereka memastikan tidak menimbulkan kontroversi apa pun saat perilisannya.

Peluncuran fitur-fitur baru ini direncanakan untuk dua minggu ke depan. Mereka akan dapat diakses oleh pelanggan Plus dan Enterprise pada awalnya. Untuk menikmati fitur suara, pengguna perlu menavigasi ke 'pengaturan' pada aplikasi, memilih 'fitur baru', ikut serta dalam percakapan suara, ketuk tombol headphone yang terletak di sudut kanan atas, dan terakhir, pilih suara yang disukai.

Pertama-tama, hanya pengguna aplikasi ChatGPT Android dan iOS yang dapat merasakan percakapan suara dalam versi beta keikutsertaan. Namun, fitur pencarian berbasis gambar akan tersedia di semua platform secara default.

Banyak platform no-code, seperti AppMaster, sangat menantikan untuk melihat beragam aplikasi yang akan dihasilkan oleh ChatGPT yang ditingkatkan ini dalam waktu dekat. Membangun perangkat lunak perusahaan tanpa kode sering kali memerlukan bantuan AI yang canggih untuk interaktivitas yang unggul dan peningkatan pengalaman pengguna.

Posting terkait

AppMaster di BubbleCon 2024: Menjelajahi Tren Tanpa Kode
AppMaster di BubbleCon 2024: Menjelajahi Tren Tanpa Kode
AppMaster berpartisipasi dalam BubbleCon 2024 di NYC, memperoleh wawasan, memperluas jaringan, dan menjajaki peluang untuk mendorong inovasi dalam ruang pengembangan tanpa kode.
Rangkuman FFDC 2024: Wawasan Utama dari Konferensi Pengembang FlutterFlow di NYC
Rangkuman FFDC 2024: Wawasan Utama dari Konferensi Pengembang FlutterFlow di NYC
FFDC 2024 memeriahkan Kota New York, menghadirkan wawasan mutakhir bagi para pengembang dalam pengembangan aplikasi dengan FlutterFlow. Dengan sesi yang dipandu oleh para ahli, pembaruan eksklusif, dan jaringan yang tak tertandingi, acara ini merupakan acara yang tidak boleh dilewatkan!
PHK di Sektor Teknologi Tahun 2024: Gelombang Berkelanjutan yang Mempengaruhi Inovasi
PHK di Sektor Teknologi Tahun 2024: Gelombang Berkelanjutan yang Mempengaruhi Inovasi
Dengan pemutusan hubungan kerja (PHK) 60.000 di 254 perusahaan, termasuk raksasa seperti Tesla dan Amazon, pada tahun 2024 akan terjadi gelombang PHK di sektor teknologi yang terus membentuk kembali lanskap inovasi.
Mulai Gratis
Terinspirasi untuk mencoba ini sendiri?

Cara terbaik untuk memahami kekuatan AppMaster adalah dengan melihatnya sendiri. Buat aplikasi Anda sendiri dalam hitungan menit dengan langganan gratis

Hidupkan Ide Anda